`
yanghuidang
  • 浏览: 914180 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

ORA-03113错误分析

阅读更多

Fenng(Fenng@itpub.net)

版权声明:转载请注明作者及出处

前言

每一个DBA在进行数据库管理的过程中不可避免的要遇到形形色色的错误(ORA-xxxx).有些错误由于频繁出现、原因复杂而被DBA们戏称之为"经典的错误".其中ORA-3113 "end of fileon communication channel" 就是这样的一个.

我们可以简单的把这个错误理解为Oracle客户端进程和数据库后台进程连接中断.不过,导致这个错误的原因实际上有很多种,对数据库设置不当、任何能导致数据库后台进程崩溃的行为都可能产生这个错误.这个错误的出现还经常伴随着其它错误,比如说:ORA-1034 ORACLE not available.

此外,该错误出现的场景复杂,可能出现在:

  • 启动的Oracle的时侯;
  • 试图创建数据库的时侯;
  • 试图对数据库进行连接的时侯;
  • 在客户端正在运行SQL/PL/SQL的时侯;
  • 备份/恢复数据库的时侯;
  • 其它一些情况下......

在论坛上也时常可以看到初级DBA对这个问题的求救. 在这里简单的对该问题进行一下整理.不当之处,请多指教!


错误原因种种

根据网络上大家反映的情况来看,错误原因大约有这些:

  • Unix核心参数设置不当
  • Oracle执行文件权限不正确/环境变量问题
  • 客户端通信不能正确处理
  • 数据库服务器崩溃/操作系统崩溃/进程被kill
  • Oracle 内部错误
  • 特定SQL、PL/SQL引起的错误
  • 空间不够
  • 防火墙的问题
  • 其它原因

在开始解决问题之前,作如下几件事情:

1、回忆一下在出现错误之前你都做了什么操作,越详细越好;
2、查看background_dump_dest目录中的alertSID.log文件也是你要做的事情;
3、Google一下,在互联网上有很多信息等着你去发现,不要什么都问别人.当然,如果你找到了一些对你非常有帮助的东西――这篇文档就不用看了,别耽误你的时间,呵呵.


Unix核心参数设置不当/ init参数设置不当

如果数据库在安装过程中没有设定正确的操作系统核心变量,可能在安装数据库文件的时侯
没甚么问题,在创建数据库的时侯常常会出现03113错误.和此有关的另一个原因是init.ora
参数文件中的processes参数指定了不合理的值,启动数据库导致错误出现(当然这个归根到
底也是核心参数的问题).

这个错误信息一般如下:

ORA-03113: end-of-file on communication channel
ORA-01034: ORACLE not available
ORA-27101: shared memory realm does not exist

解决办法有两个:
1修改核心参数,加大相应核心参数的值(推荐);
2减小init.ora参数的Processes的值.

需要注意的是:
SEMMSL必须设定为至少要10 + 进程数的最大值.
SEMMNS 也依赖于每个数据库上的进程参数值.

-------------------------------------------------------------------------------
注:
这个错误类型只在Unix平台上出现.在Windows上如果processes的值过大,则会出现:
ORA-00068: invalid value 24200001 for parameter max_rollback_segments, must be
between 2 and 65535 /* 此时指定的参数值超过了65535 */
或者
ORA-27102: out of memory /* 小于65535的一个大参数值 */
我的软件环境:
Windows 2000 Version 5.0 Service Pack 3, CPU type 586
ORACLE RDBMS Version: 8.1.7.0.0.
-------------------------------------------------------------------------------


在特定平台上更改核心参数可能会有差别,请参考Oracle Technet(http://otn.oracle.com)上的安装文档.对特定Unix平台的安装文档也有对核心参数意义的解释.

Init.ora中的参数如果设置不当,会产生该错误.有经验表明:shared_pool_size设置过小会出现错误,此外timed_statistics=true的设置也会带来问题.


Oracle执行文件权限不正确/环境变量问题

这个问题只出现在Unix平台上.常见情况是有的时侯管理员为了方便而使用Unix
的tar命令处理过的压缩包进行的安装,或者是系统管理员指定了额外的OS用户也可以管理数
据库却没有指定正确的环境变量.

Oracle执行文件在$ORACLE_HOME/bin目录下,如果出现问题,应该用如下Unix类似命令来纠正:

chmod 7755 $ORACLE_HOME/bin/oracle

有的时侯要对Oracle进行relink操作.
在Unix上通过cp拷贝安装的时候,常常会出现环境变量的问题,和个别执行程序连接问题.LD_
LIBRARY_PATH如果设置的不正确会导致问题,在这种情况下,需要对Oracle进行relink.如果
可执行文件oralcle被破坏,也要对其relink.

如果安装了并行服务器选项而Distributed Lock Manager没有安装或正确运行也会导致错误.


客户端通信不能正确处理

SQL*Net驱动器的问题:
如果使用的版本比较低的驱动器,请更换到新版本的驱动.SQL*Net
的驱动没有连接到Oracle可执行文件会导致错误.

检查网络是否通畅

Windows平台的常见问题:
在Windows平台创建数据库的时侯,如果出现该问题可以考虑用如下的方法:
首先检查本地网络设置.查看网络上是否有同名的结点或有冲突的IP.如果问题依旧,可以保
守的用下面的方法:
1.禁用网卡:将本地连接状态改为禁用;
2.将sqlnet.ora文件打开(以记事本形式)将nts验证注释掉:
#SQLNET.AUTHENTICATION_SERVICES= (NTS).
3.创建数据库;
4.创建成功后,恢复本地连接.

数据库服务器崩溃/操作系统崩溃/进程被Kill

在连接过程中,如果Oracle数据库的服务器崩溃或者数据库所在的操作系统崩溃,就会出现这
个错误.Oracle Server崩溃的原因可能因为主要后台进程死掉.被错误的进行了Kill操作.如果是这个原因还是比较容易解决的.此外,和OS有关的应用程序存在内存泄漏(或者有病毒)的时侯也会导致Oracle后台程序问题.

推荐排错办法:
1、查看应用软件相关进程是否正常运行;
2、查看有无内存泄漏;
3、查杀病毒;
4、确定系统管理员没有进行误操作;
5、确定无黑客入侵行为.
6、其它不确定因素......


Oracle 内部错误/ Bug

如果查看background_dump_dest目录中的alert.log发现有无ora-600等错误,可以到Metalin
k站点上查看具体信息及其解决方案.一般情况下要打软件补丁.


特定SQL、PL/SQL引起的错误

尝试把SQL进行分开执行,也可以用SQL_TRACE来进行跟踪,找到导致问题的SQL语句:
在SQLPlus下:
ALTER SESSION SET SQL_TRACE TRUE;

SQL语句中的非法字符和不合理的处理结果偶尔会带来问题.


系统空间不够

任何时侯都要确保数据库系统有足够的空间.如果 USER_DUMP_DEST
和BACKGROUND_DUMP_DEST没有剩余空间的话,会导致此问题.此外,如果打开了审计,AUDIT目录要由足够的空间.如果激活了Trace的话,Trace目录要由足够的空间.

Dave Wotton的文档表明,在对表进行插入数据的时侯,如果文件超过了2G(而文件系统有2G限制),会导致该问题.


防火墙的问题

如果数据要通过防火墙,请联系系统管理员,询问是否对数据库数据进行了过滤或者是突然禁
止了通行端口.如本地安装有个人防火墙,请检查本地设置.


其它方面说明

导致这个错误的原因有很多种,上面列到的只是一些典型情况.经常去一些数据库技术论坛可
能会有帮助.比如说ITPUB(

http://www.itpub.net)、CNOUG(http://www.cnoug.org)等.


参考信息/更多阅读

http://Metalink.oracle.com
Oracle的技术支持站点,要有CSI号码才可以登录.
参考Note编号:
Note:17613.1
ORA-3113 on Unix - What Information to Collect
NOTE:131207.1
How to Set UNIX Environment Variables
Note:131321.1
How to Relink Oracle Database Software on UNIX
Note:22080.1

http://www.google.com/grphp?hl=zh-CN 
Google新闻组

http://www.jlcomp.demon.co.uk/faq/ORA-3113.html
技术专家Jonathan Lewis的站点上的一个FAQ

http://home.clara.net/dwotton/dba/ora3113.htm
Dave Wotton总结的一个很经典的文档.

分享到:
评论

相关推荐

    Oracle-03113错误详细分析与解决办法

    每一个DBA在进行数据库管理的过程中不可避免的要遇到形形色色的错误(ORA- 1547 ,ORA-904,ORA-1578 ......)。有些错误由于频繁出现、原因复杂而被 Oracle DBA ...本文将为大家介绍Oracle-03113错误详细分析与解决办法。

    ORA-04031故障分析处理

    如果内存块仍然不够满足需求,那么就会出现ORA- 04031错误。这些错误同样可能发生在ASM的实例中。默认的共享池的大小基本能够满足大部分的环境,但是如果遇到ORA-04031错误的时候可能就需要增大。 当遇到这个错误的...

    ora-01460 错误原因分析

    ORA-01460: 转换请求无法实现或不合理

    ORA-20011_ORA-06564_info.html

    ORA-20011,ORA06564错误分析

    如何解决Oracle 常见错误 ORA-04031(PDF)

    Oracle 常见错误 ORA-04031(PDF) 如何解决ORA-04031 错误 文章内容 1.和共享池(shared pool)相关的实例参数 2.诊断ORA-04031 错误 3.解决ORA-04031 错误 • 已知的Oracle BUG ...4.对ORA-04031 的高级分析

    ORA-01480STR 绑定值的结尾 Null字符缺失 的问题原因及解决办法

    本人在工作中,从测试库往正式库中复制记录,用select for update 报错:ORA-01480:STR 绑定值的结尾 Null字符缺失 ,遂上网查找,都说是有非法字符(半个引号) 或者长度超长造成的。根据本人分析,应该不是上述原因...

    ORA-01555错误浅析

    ORA-01555错误浅析,分析的很好

    ORA-01631错误的处理办法

    max # extents (string) reached in table string.string的错误提示,分析及解决办法如下

    ORA错误分析及解决

    资料整理,包括: 一些ORACLE问题如ORA-01555,ORA-07445的分析和解决, 以及FAST_START_MTTR_TARGET相关的4个参数设置

    实例解析acle ORA-00903错误的具体原因

    本文分析了实例解析acle ORA-00903错误的具体原因:表名或簇名不存在或无效,当运行ALTER CLUSTER或 DROP CLUSTER语句时,会出现此错误信息。解决方法:检查拼写是否正确。一个有效的表名或簇名必须以字母开头,只...

    ORA-02298: 无法验证 (约束)提示未找到父项关键字的解决办法

    –在用PL/SQL导入表数据的时候报错 ORA-02298: 无法验证 (PNET.POST_CLOB_FK) – 未找到父项关键字 --发现是启用外键约束时报的错 alter table DM_VOLREV enable constraint VR_VOLID_FK; /*原因分析: 你要插入...

    解决报错ora-32035的方法分析

    报错ora-32035如果定义了with子句,而在查询中不使用,那么会报ora-32035 错误:未引用在with子句中定义的查询名。(至少一个with查询的name未被引用,解决方法是移除未被引用的with查询),注意:只要后面有引用的...

    PL/SQL登录Oracle数据库报错ORA-12154:TNS:无法解析指定的连接标识符已解决(本地未安装Oracle需要连接服务器上的)

    错误分析一、PL/SQL 客户端登录到数据库,如果配置错误会有以上错误,如下图。 这个错误主要是pl/sql客户端的tnsnames.ora配置错误,或者是输入 database选项错误。 错误分析二、未配置环境变量 所以解决问题之前...

    ORA-00947:Not enough values (没有足够的值)的深入分析

    ORA-00947: Not enough values 执行insert的时候出现这个错误。 insert into 表1 values (123,2423,12); 表1的结构有4个column,显然插入的值只有三个,因此才会出现这个问题。 再加个column 的值执行后,ok。 倘若...

    Oracle常见错误代码的分析与解决

    Oracle常见错误代码的分析与解决Oracle常见错误代码的分析与解决Oracle常见错误代码的分析与解决Oracle常见错误代码的分析与解决

    oracle_10g的闪回设置

    startup 时报错误信息 ORA-16038: 日志 2 序列号 225 无法归档 ORA-19809: 超出了恢复文件数的限制 ORA-00312: 联机日志 2 线程 1: 'O:\ORACLE\ORADATA\ORACLE10\REDO02.LOG' 分析为日志损坏

    Oracle11g体系结构深入剖析和运维管理(五)

    资源名称:Oracle 11g体系结构深入剖析和运维管理(五)资源目录:【】37_深入剖析事务槽及Oracle多种提交方式【】38_OracleIMU及RedoPrivateStrands技术【】39_读一致性(ORA-01555错误机制分析)及Undo表空间大小设置...

    小结SQLServer连接失败错误及解决

    一般而言,有以下两种连接SQLServer的方式,一是利用SQLServer自带的客户端工具,如企业管理器、查询分析器、事务探查器等;二是利用用户自己开发的客户端程序,如ASP脚本、VB程序等,客户端程序中又是利用ODBC或者...

    Oracle11g体系结构深入剖析和运维管理(二)

    【】10_SQL语句执行过程剖析【】11_SQL语句解析类型_硬解析_软解析【】12_shared内存块组成结构及4031错误产生原因分析【】13_共享SQL减少硬解析【】14_如何解决ORA-04031错误【】15_如何设置sharedpool及sga的大小...

    Oracle数据库共享池空间管理调优 (2015年)

    Oracle数据库是当前使用最为广泛的大型...通过导出Oracle数据库共享池的内存数据的方法,总结并分析共享池空间管理的内部管理机制,找到空闲空间较多而报ORA-4031错误的原因,给出了错误检测方法和相对应的解决方法。

Global site tag (gtag.js) - Google Analytics