跳到主要内容

电源线路中断后验证运行情况

可以测试 MetroCluster 配置对 PDU 故障的响应。

关于本任务

最佳实践方法是将组件中的每个电源模块单元(PSU)连接到单独的电源模块。如果两个 PSU 连接到相同的配电单元(PDU)并发生电气中断,站点可能会停机或整个磁盘架可能无法使用。通过测试一条电源线路的故障,可以确认不存在可能导致服务中断的布线不匹配问题。

此测试应该需要大约 15 分钟。

此测试需要在包含 MetroCluster 组件的所有机架上关闭所有左侧 PDU 的电源,然后关闭所有右侧 PDU 的电源。

此过程具有以下预期结果:

  • PDU 断开连接后应该会产生错误。

  • 不应发生故障转移或服务中断。

  1. 在包含 MetroCluster 组件的机架左侧关闭 PDU 的电源。
  2. 使用 system environment sensors show -state faultstorage shelf show -errors 命令在控制台上监控结果。

    示例

    cluster_A::> system environment sensors show -state fault

    Node Sensor State Value/Units Crit-Low Warn-Low Warn-Hi Crit-Hi
    ---- --------------------- ------ ----------- -------- -------- ------- -------
    node_A_1
    PSU1 fault
    PSU_OFF
    PSU1 Pwr In OK fault
    FAULT
    node_A_2
    PSU1 fault
    PSU_OFF
    PSU1 Pwr In OK fault
    FAULT
    4 entries were displayed.

    cluster_A::> storage shelf show -errors
    Shelf Name: 1.1
    Shelf UID: 50:0a:09:80:03:6c:44:d5
    Serial Number: SHFHU1443000059

    Error Type Description
    ------------------ ---------------------------
    Power Critical condition is detected in storage shelf power supply unit "1". The unit might fail.
    Reconnect PSU1

  3. 重新打开左侧 PDU 的电源。
  4. 确保 ONTAP 消除了错误情况。
  5. 使用右侧 PDU 重复执行上述步骤。