IT咨询服务AIXOracleemc存储

AIX 7.1 DISK OPERATION ERROR?

AIX主机上运行的ORACLE数据库,多路径软件用的AIX自带的,没有用powerapth,现在经常报DISK OPERATION ERROR ,每次报这个错误的时候,数据库就会无法读写挂起状态,查看主机监控发现所有存储盘的读写流量瞬间降低为0,主机和存储人员检查光纤交换机上无报错;出现问题比较常见,有时候是晚上备份的时候,有时候是数据库添加一个50M的datafile都会在AIX主机层面报这样的错误。
[root@xxxxxx: /]#errpt|more
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
DCB47997 0430170924 T H hdisk31 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk31 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk25 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk31 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk3 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk27 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk32 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk25 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk31 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk3 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk26 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk27 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk32 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk4 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk25 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk31 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk26 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk3 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk24 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk32 DISK OPERATION ERROR
DCB47997 0430170924 T H hdisk4 DISK OPERATION ERROR

参与6

2同行回答

BenBen系统工程师个人
看看是不是磁盘被别人的主机占用了?你现在的日志只有DCB47997,还有其他报错吗?把snap收集一下,传到http://hongxu.wang:4241 上去解析一下看看,那里能decode链路报错,看看有没有有什么发现。...显示全部

看看是不是磁盘被别人的主机占用了?
你现在的日志只有DCB47997,还有其他报错吗?
把snap收集一下,传到http://hongxu.wang:4241 上去解析一下看看,那里能decode链路报错,看看有没有有什么发现。

收起
系统集成 · 3天前
+zhpeng01可以联系帮忙解决问题。+zhpeng01可以联系帮忙解决问题。系统工程师信息系统有限公司
你的这个问题还是物理链路的问题,可以查看存储管理界面里的告警信息或者光纤交换机里的端口告警信息,然后需要安装存储自带的多路径管理软件才能让存储跑出最优速度。显示全部

你的这个问题还是物理链路的问题,可以查看存储管理界面里的告警信息或者光纤交换机里的端口告警信息,然后需要安装存储自带的多路径管理软件才能让存储跑出最优速度。

收起
IT分销/经销 · 2024-05-01
浏览106

ChatGPT 回答

根据您提供的信息,这个问题可能是由于磁盘故障或者存储系统故障引起的。建议您采取以下步骤进行排查:

  1. 检查磁盘状态:使用lspv命令检查所有磁盘的状态,查看是否有磁盘处于“missing”或“stale”状态。如果有,可能是磁盘故障导致的。
  2. 检查存储系统状态:联系存储管理员,检查存储系统的状态,查看是否有存储系统故障或者存储池空间不足等问题。
  3. 检查文件系统:使用fsck命令检查文件系统是否有损坏,如果有,需要修复文件系统。
  4. 检查多路径软件:如果使用的是AIX自带的多路径软件,建议升级到最新版本。如果使用的是第三方多路径软件,建议联系供应商进行排查。
  5. 检查数据库:检查数据库日志,查看是否有异常,例如IO错误等。
  6. 检查网络连接:检查网络连接是否正常,包括光纤交换机、网卡等。

如果以上步骤都没有解决问题,建议联系AIX、Oracle、emc存储的技术支持团队,进行更深入的排查。

提问者

monotseng
数据库开发工程师xx保险
擅长领域: 服务器主机存储

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2024-04-30
  • 关注会员:3 人
  • 问题浏览:552
  • 最近回答:3天前
  • X社区推广