运行系统级诊断程序
每次更换控制器后,都应该对特定组件和子系统运行全面或针对性的诊断测试。
关于本任务
诊断过程中的所有命令都是从要更换组件的控制器发出的。
- 如果要维护的控制器未处于装入程序提示符处,请输入以下命令来重新启动控制器:halt
发出该命令后,应等待系统停在装入程序提示符处。
- 在装入程序提示符处,访问专门设计用于系统级诊断以确保正常运行的特殊驱动程序:boot_diags 引导过程中,针对提示问题可放心地回答 y,直至显示维护模式提示符(*>)。
- 显示并记录控制器模块上的可用设备:sldiag device show -dev mb
显示的控制器模块设备和端口可以是以下任何一种或多种类型:
- bootmedia 为系统引导设备。
- cna 为未连接到网络或存储设备的聚合网络适配器或接口。
- fcal 为未连接到 Fibre Channel 网络的 Fibre Channel 仲裁环路设备。
- env 为主板环境。
- mem 为系统内存。
- nic 为网络接口卡。
- nvram 为非易失性 RAM。
- nvmem 为 NVRAM 和系统内存的混合。
- sas 为未连接到磁盘架的串行连接 SCSI 设备。
- 从维护菜单中对每个组件运行诊断程序。例如:sldiag device status -dev nvmem -long -state failed
如果要运行诊断测试的是... 则... 各个组件 - 清除状态日志:sldiag device clearstatus
显示所选设备的可用测试:sldiag device show -dev dev_name
dev_name 可以是前一步中识别的任何一个端口和设备。
检查输出,并在适用时仅选择要运行的测试:sldiag device modify -dev dev_name -selection only
-selection only 可禁用不需要为该设备运行的所有其他测试。
运行所选的测试:sldiag device run -dev dev_name
测试完毕后,将显示以下消息:*> <SLDIAG:_ALL_TESTS_COMPLETED>
确认没有测试失败:sldiag device status -dev dev_name -long -state failed
系统级诊断程序会返回到提示符处(如果没有测试失败),或列出组件测试失败的完整状态。
同时间的多个组件 - 在上述过程的输出中查看已启用和已禁用的设备,并确定要同时运行诊断程序的测试。
- 列出设备的各个测试:sldiag device show -dev dev_name
检查输出,并在适用时仅选择要运行的测试:sldiag device modify -dev dev_name -selection only
-selection only 可禁用不需要为该设备运行的所有其他测试。
- 确认已修改测试:sldiag device show
- 对需要同时运行诊断程序的每个设备重复以上子步骤。
- 对所有设备运行诊断程序:sldiag device run注意在开始运行诊断程序后,请勿添加或修改条目。测试完毕后,将显示以下消息:
*> <SLDIAG:_ALL_TESTS_COMPLETED>
确认控制器上没有任何硬件问题:sldiag device status -long -state failed
系统级诊断程序会返回到提示符处(如果没有测试失败),或列出组件测试失败的完整状态。
- 根据上一步的结果继续操作。
如果系统级诊断测试... 则... 已完成且没有任何错误 - 清除状态日志:sldiag device clearstatus
确认已清除日志:sldiag device status
随后将显示以下默认响应:
SLDIAG: No log messages are present.
通过输入以下命令退出维护模式:halt
系统将显示装入程序提示符。
输入 boot_ontap 使控制器恢复正常运行状态。
导致某些测试失败 确定问题的原因。 - 退出维护模式:halt
- 执行干净关机,然后断开电源模块。
- 确认已查看有关运行系统级诊断程序的所有注意事项,线缆已牢固连接,且硬件组件已正确安装在存储系统中。
- 接回电源模块,然后打开存储系统电源。
- 重新运行系统级诊断测试。
提供反馈