跳到主要内容

运行系统级诊断程序

安装新的机箱后,应运行互连诊断程序。

开始之前

系统必须位于装入程序提示符处以进入维护菜单,通过此菜单即可启动系统级诊断程序。

诊断过程中的所有命令都是从要更换组件的控制器发出的。

  1. 如果要维护的控制器未处于装入程序提示符处,请执行以下步骤:
    1. 通过输入 halt 选择引导至维护模式的选项
    2. 位于装入程序提示符下之后,输入 boot_ontap menu
    3. 当系统显示在选择菜单中时,选择选项 5 以进入维护模式。
  2. 如果采用的是 HA 配置,请对第二个控制器重复上述步骤。
    两个控制器都必须处于维护模式才能运行互连测试。
  3. 对高速缓存模块运行诊断程序:sldiag device run -dev fcache
  4. 从维护模式提示符处启用互连诊断测试:sldiag device modify -dev interconnect -sel enable

    默认情况下已禁用互连测试,必须单独启用这些测试来运行测试。

  5. 从维护模式提示符处运行互连诊断测试:sldiag device run -dev interconnect

    只需从一个控制器上运行互连测试。

  6. 确认没有因更换机箱而产生任何硬件问题:sldiag device status -dev interconnect -long -state failed
    系统级诊断程序会返回到提示符处(如果没有测试失败),或列出组件测试失败的完整状态。
  7. 根据上一步的结果继续操作。
    如果系统级诊断测试...则...
    已完成且没有任何错误
    1. 清除状态日志:sldiag device clearstatus
    2. 确认已清除日志:sldiag device status

      随后将显示以下默认响应:

      SLDIAG: No log messages are present.

    3. 在两个控制器上均退出维护模式:halt

      系统将显示装入程序提示符。

      注意
      必须先在两个控制器上退出维护模式,然后再继续操作。
    4. 在两个控制器上的装入程序提示符处输入以下命令:boot_ontap
    5. 使控制器恢复正常运行状态:
      如果系统正在运行 ONTAP...则...
      且集群中有两个控制器发出以下命令:node::> cluster ha modify -configured true node::> storage failover modify -node node0 -enabled true
      且集群中的控制器超过两个发出以下命令:node::> storage failover modify -node node0 -enabled true

    您已完成系统级诊断。

    导致某些测试失败确定问题的原因。
    1. 退出维护模式:halt
    2. 执行干净关机,然后断开电源模块。
    3. 确认已查看有关运行系统级诊断程序的所有注意事项,线缆已牢固连接,且硬件组件已正确安装在存储系统中。
    4. 接回电源模块,然后打开存储系统电源。
    5. 重新运行系统级诊断测试。