运行设备故障诊断程序
运行诊断程序可以帮助您确定特定设备存在间歇性访问问题的原因或设备在存储系统中不可用的原因。
- 在存储系统提示符处,切换至装入程序提示符:halt
- 在装入程序提示符处输入以下命令:boot_diags 注必须从装入程序提示符处运行此命令才能使系统级诊断程序正常运行。boot_diags 命令将启动专为系统级诊断程序设计的驱动程序。
- 通过输入以下命令对导致问题的设备运行诊断程序:sldiag device run [-dev devtype|mb|slotslotnum] [-name device]
- -dev devtype 指定要测试的设备的类型。
- ata 为高级技术附件设备。
- bootmedia 为系统引导设备。
- cna 为未连接到网络或存储设备的聚合网络适配器。
- env 为主板环境。
- fcache 为 Flash Cache 适配器(也称为“性能加速模块 2”)。
- fcal 为未连接到存储设备或 Fibre Channel 网络的 Fibre Channel 仲裁环路设备。
- fcvi 为未连接到 Fibre Channel 网络的 Fiber Channel 虚拟接口。
- interconnect 或 nvram-ib 为高可用性接口。
- mem 为系统内存。
- nic 为未连接到网络的网络接口卡。
- nvram 为非易失性 RAM。
- nvmem 为 NVRAM 和系统内存的混合。
- sas 为未连接到磁盘架的串行连接 SCSI 设备。
- serviceproc 为服务处理器。
- storage 为具有附加磁盘架的 ATA、FC-AL 或 SAS 接口。
- toe 为 TCP 卸载引擎(一种 NIC)。
- mb 指定要测试所有主板设备。
- slot slotnum 指定要测试特定插槽号中的设备。
- -name device 指定给定设备类和类型。
- -dev devtype 指定要测试的设备的类型。
- 通过输入以下命令来查看测试的状态:sldiag device status测试仍在运行期间,存储系统会提供以下输出:所有测试均完成后,默认情况下将显示以下响应:
There are still test(s) being processed.
*> <SLDIAG:_ALL_TESTS_COMPLETED>
- 通过输入以下命令来识别所有硬件问题:sldiag device status [-dev devtype|mb|slotslotnum] [-name device] -long -state failed
示例
以下示例显示了测试 FC-AL 适配器时产生的故障完整状态:
*> sldiag device status fcal -long -state failed
TEST START ------------------------------------------
DEVTYPE: fcal
NAME: Fcal Loopback Test
START DATE: Sat Jan 3 23:10:56 GMT 2009
STATUS: Completed
Starting test on Fcal Adapter: 0b
Started gathering adapter info.
Adapter get adapter info OK
Adapter fc_data_link_rate: 1Gib
Adapter name: QLogic 2532
Adapter firmware rev: 4.5.2
Adapter hardware rev: 2
Started adapter get WWN string test.
Adapter get WWN string OK wwn_str: 5:00a:098300:035309
Started adapter interrupt test
Adapter interrupt test OK
Started adapter reset test.
Adapter reset OK
Started Adapter Get Connection State Test.
Connection State: 5
Loop on FC Adapter 0b is OPEN
Started adapter Retry LIP test
Adapter Retry LIP OK
ERROR: failed to init adaptor port for IOCTL call
ioctl_status.class_type = 0x1
ioctl_status.subclass = 0x3
ioctl_status.info = 0x0
Started INTERNAL LOOPBACK:
INTERNAL LOOPBACK OK
Error Count: 2 Run Time: 70 secs
>>>>> ERROR, please ensure the port has a shelf or plug.
END DATE: Sat Jan 3 23:12:07 GMT 2009
LOOP: 1/1
TEST END --------------------------------------------如果系统级诊断测试... 则... 导致某些测试失败 确定问题的原因。 - 通过输入以下命令退出维护模式:halt
- 执行干净关机并断开电源模块。
- 确认已查看有关运行系统级诊断程序的所有注意事项,线缆已牢固连接,且硬件组件已正确安装在存储系统中。
- 接回电源模块并打开存储系统电源。
- 重复运行设备故障诊断程序 中的步骤 1 至 5。
导致相同的测试失败问题 技术支持人员可能建议修改某些测试的默认设置,以帮助找出问题。 通过输入以下命令修改存储系统上特定设备或设备类型的选择状态:sldiag device modify [-dev devtype|mb|slotslotnum] [-name device] [-selection enable|disable|default|only]
-selection enable|disable|default|only 可启用、禁用指定的设备类型或设备,接受默认情况下选择的设备,或通过先禁用所有其他设备而仅启用指定设备。
- 通过输入以下命令来确认已修改测试:sldiag option show
- 重复运行设备故障诊断程序 中的步骤 3 至 5。
- 找出并解决问题后,重复子步骤 1 和 2 以将测试重置为 default 状态。
- 重复运行设备故障诊断程序 中的步骤 1 至 5。
已完成且没有任何错误 没有硬件问题,存储系统将返回到提示符处。 - 通过输入以下命令来清除状态日志:sldiag device clearstatus [-dev devtype|mb|slotslotnum]
- 通过输入以下命令来确认已清除日志:sldiag device status [-dev devtype|mb|slotslotnum]
随后将显示以下默认响应:
SLDIAG: No log messages are present.
- 通过输入以下命令退出维护模式:halt
- 在装入程序提示符处输入以下命令以引导存储系统:boot_ontap
您已完成系统级诊断。
完成之后
如果重复这些步骤后故障仍然存在,需要更换硬件。
提供反馈