跳到主要内容

运行系统级诊断程序

每次更换控制器后,都应该对特定组件和子系统运行全面或针对性的诊断测试。

关于本任务

诊断过程中的所有命令都是从要更换组件的控制器发出的。

  1. 如果要维护的控制器未处于装入程序提示符处,请输入以下命令来重新启动控制器:halt

    发出该命令后,应等待系统停在装入程序提示符处。

  2. 装入程序提示符处,访问专门设计用于系统级诊断以确保正常运行的特殊驱动程序:boot_diags
    引导过程中,针对提示问题可放心地回答 y,直至显示维护模式提示符(*>)。
  3. 显示并记录控制器模块上的可用设备:sldiag device show -dev mb

    显示的控制器模块设备和端口可以是以下任何一种或多种类型:

    • bootmedia 为系统引导设备。
    • cna 为未连接到网络或存储设备的聚合网络适配器或接口。
    • fcal 为未连接到 Fibre Channel 网络的 Fibre Channel 仲裁环路设备。
    • env 为主板环境。
    • mem 为系统内存。
    • nic 为网络接口卡。
    • nvram 为非易失性 RAM。
    • nvmem 为 NVRAM 和系统内存的混合。
    • sas 为未连接到磁盘架的串行连接 SCSI 设备。
  4. 从维护菜单中对每个组件运行诊断程序。例如:sldiag device status -dev nvmem -long -state failed
    如果要运行诊断测试的是...则...
    各个组件
    1. 清除状态日志:sldiag device clearstatus
    2. 显示所选设备的可用测试:sldiag device show -dev dev_name

      dev_name 可以是前一步中识别的任何一个端口和设备。

    3. 检查输出,并在适用时仅选择要运行的测试:sldiag device modify -dev dev_name -selection only

      -selection only 可禁用不需要为该设备运行的所有其他测试。

    4. 运行所选的测试:sldiag device run -dev dev_name

      测试完毕后,将显示以下消息:
      *> <SLDIAG:_ALL_TESTS_COMPLETED>

    5. 确认没有测试失败:sldiag device status -dev dev_name -long -state failed

      系统级诊断程序会返回到提示符处(如果没有测试失败),或列出组件测试失败的完整状态。

    同时间的多个组件
    1. 在上述过程的输出中查看已启用和已禁用的设备,并确定要同时运行诊断程序的测试。
    2. 列出设备的各个测试:sldiag device show -dev dev_name
    3. 检查输出,并在适用时仅选择要运行的测试:sldiag device modify -dev dev_name -selection only

      -selection only 可禁用不需要为该设备运行的所有其他测试。

    4. 确认已修改测试:sldiag device show
    5. 对需要同时运行诊断程序的每个设备重复以上子步骤。
    6. 对所有设备运行诊断程序:sldiag device run
      注意
      在开始运行诊断程序后,请勿添加或修改条目。
      测试完毕后,将显示以下消息:
      *> <SLDIAG:_ALL_TESTS_COMPLETED>

    7. 确认控制器上没有任何硬件问题:sldiag device status -long -state failed

      系统级诊断程序会返回到提示符处(如果没有测试失败),或列出组件测试失败的完整状态。

  5. 根据上一步的结果继续操作。
    如果系统级诊断测试...则...
    已完成且没有任何错误
    1. 清除状态日志:sldiag device clearstatus
    2. 确认已清除日志:sldiag device status

      随后将显示以下默认响应:

      SLDIAG: No log messages are present.

    3. 通过输入以下命令退出维护模式:halt

      系统将显示装入程序提示符。

    4. 输入 boot_ontap 使控制器恢复正常运行状态。

    导致某些测试失败确定问题的原因。
    1. 退出维护模式:halt
    2. 执行干净关机,然后断开电源模块。
    3. 确认已查看有关运行系统级诊断程序的所有注意事项,线缆已牢固连接,且硬件组件已正确安装在存储系统中。
    4. 接回电源模块,然后打开存储系统电源。
    5. 重新运行系统级诊断测试。