跳到主要内容

漏水和漏液传感器问题

按以下信息解决与漏水和漏液传感器相关的问题。

N1380 机柜和 SC750 V4 托盘SC777 V4 托盘设计可靠,发生漏液的可能性极低。如果发现机柜外有水,请确保同时断开机柜和机柜电源管理转换站(PCS)的连接。如果未发现机柜外有水,但是怀疑机柜内或八个托盘中的某一个漏水,请完成以下步骤确定漏水处。
  • 微量漏水可能不会到达漏液传感器,因此不会触发警告。可能需要通过肉眼观察来判断是否存在微量漏水。

  • 上面的过程仅涵盖 Lenovo DWC 解决方案(从 Eaton 球阀向上穿过歧管,再到机柜和托盘中)。如果数据中心配冷装置反复或经常遇到水量低警报,则应检查配冷装置和 Lenovo DWC 解决方案(机架)之间的数据中心管路系统。

可疑漏水症状

漏水问题可能导致出现下列情况:
  • 节点正面的系统错误“!”LED 常亮,指示处理器温度过高错误

  • 整个机柜意外关闭(包括所有节点、PCS 和 SMM3)

  • 机柜 SMM3 管理功能可能会报告与漏水和漏液传感器相关的事件。有关详细信息,请参阅下文。

漏液的可能原因

以下是漏液的可能原因:
  • 安装或卸下过程中快接件有漏点

  • 水循环模块管有漏点

通过 SMM3 消息识别漏液类型

按照以下步骤通过 SMM3 消息识别漏液类型。
  1. 查看 SMM3 消息。

    • 发生漏水时,已开机的节点将在五秒内关闭,已关机的节点将在一秒内关闭。在通常的做法中,会有一个集中式服务器管理工具来收集 SMM3 消息。检查管理工具中是否有 SMM3 消息。

  2. 根据 SMM3 消息确定要检查的组件。
    1. 机柜漏液消息

      1. 请查看 消息中的用户操作

      2. 按照机柜漏液问题故障排除中的详细过程操作

        机柜漏液 SMM3 消息 ID严重性描述信息
        1A07010027警告机箱漏液传感器:其他 FRU,从正常状态到非紧急状态的转变已生效。漏液传感器异常。
        1A07020027紧急机箱漏液传感器:其他 FRU,从次严重状态到紧急状态的转变已生效。检测到泄漏。
        1A07030027紧急机箱漏液传感器:其他 FRU,从次严重状态到不可恢复状态的转变已生效。漏液传感器不存在。
    2. 托盘漏液消息

      1. 请查看 消息中的用户操作

      2. 按照托盘漏液问题故障诊断中的详细过程操作

        托盘漏液 SMM3 消息 ID严重性描述信息
        1A07010028 / 1A07010029 / 1A0701002A / 1A0701002B / 1A0701002C / 1A0701002D / 1A0701002E / 1A0701002F警告托盘 1 / 托盘 2 / 托盘 3 / 托盘 4 / 托盘 5 / 托盘 6 / 托盘 7 / 托盘 8:托盘 # 漏液传感器:其他 FRU,从正常状态到非紧急状态的转变已生效。漏液传感器异常。
        1A07020028 / 1A07020029 / 1A0702002A / 1A0702002B / 1A0702002C / 1A0702002D / 1A0702002E / 1A0702002F紧急托盘 1 / 托盘 2 / 托盘 3 / 托盘 4 / 托盘 5 / 托盘 6 / 托盘 7 / 托盘 8:托盘 # 漏液传感器:其他 FRU,从次严重状态到紧急状态的转变已生效。检测到泄漏。
        1A07030028 / 1A07030029 / 1A0703002A / 1A0703002B / 1A0703002C / 1A0703002D / 1A0703002E / 1A0703002F紧急托盘 1 / 托盘 2 / 托盘 3 / 托盘 4 / 托盘 5 / 托盘 6 / 托盘 7 / 托盘 8:托盘 # 漏液传感器:其他 FRU,从次严重状态到不可恢复状态的转变已生效。漏液传感器不存在。
    3. 电源转换站(PCS)漏液消息

      • 请查看 消息中的用户操作

      • 按照电源转换站(PCS)漏液问题故障诊断中的详细过程操作

        PCS 漏液 SMM3 消息 ID严重性受影响的 PCS描述信息
        086F01006C紧急PCS 1PCS # 漏液:电源模块,“检测到故障”已生效。检测到泄漏。
        086F01006D紧急PCS 2
        086F01006E紧急PCS 3
        086F01006F紧急PCS 4

通过电源管理转换站(PCS)LED 行为识别漏液类型

按照以下步骤通过 PCS LED 识别漏液类型。
表 1. 用于识别漏液的电源管理转换站(PCS)LED 行为
PCS LED 行为指示
  • 输入(交流)电源 LED:熄灭

  • 输出(直流)电源 LED:熄灭

  • 错误 LED:点亮

PCS 漏液。错误 LED 点亮的 PCS 中发生了漏液。

要检查漏液,请参阅

电源转换站(PCS)漏液问题故障诊断
  • 输入(交流)电源 LED:点亮

  • 输出(直流)电源 LED:熄灭

  • 错误 LED:熄灭

机柜漏液或托盘漏液。

要检查漏液,请参阅机柜漏液问题故障排除托盘漏液问题故障诊断

使用 XCC 警告消息确定泄漏类型

XCC Web 界面还会显示与漏水或漏液传感器问题相关的警告消息。要查看 XCC 警告消息,请转到 XCC Web 界面 > 事件

XCC Web GUI 警告消息指示操作

“机箱滴漏”传感器检测到冷却液已泄漏至紧急状态

机柜泄漏。

要检查漏水或检查漏液传感器,请参阅机柜漏液问题故障排除

“机箱滴漏”传感器检测到冷却液已泄漏至不可恢复状态

机柜漏液传感器可能不存在或异常。请检查机柜漏液传感器是否安装正确。

“托盘滴漏”传感器检测到冷却液已泄漏至紧急状态

托盘漏液。

要检查漏水或检查漏液传感器,请参阅托盘漏液问题故障诊断

“托盘滴漏”传感器检测到冷却液已泄漏至不可恢复状态

托盘漏液传感器可能不存在或异常。请检查机柜漏液传感器是否安装正确。

机柜漏液问题故障排除

请按照顺序完成以下步骤,直至排除潜在漏水原因。

为本任务做好准备:
  1. 确保从所有 PCS 上拔下电源线。请参阅从所有电源管理转换站(PCS)上拔下电源线

  2. 请确保您手头有以下各项:

    1. 新的机柜漏液传感器(如果检测到漏液)

    2. 短柄螺丝刀

    3. 吸水布

  3. 找到机柜中板。检查歧管上是否有水。请参阅 卸下中板组合件

    在将组件装回机柜之前,请务必用手电筒目视检查机柜底部。
如果机柜漏液传感器异常或不存在:
  1. 检查机柜漏液传感器是否安装正确。要重新安装机柜漏液传感器,请参阅更换漏液传感器

  2. 必要时,请使用吸水布擦干潮湿的组件或机柜内部。

  3. 将所有组件装回机柜。然后,将电源线连接到所有机柜 PCS,并开启机柜电源。请参阅:

  4. 如果在上述步骤中无法确定问题,则可能需要联系产品工程师以获得进一步的帮助。

如果检测到机柜漏液:
  1. 从机柜上卸下托盘。检查托盘后端快接件上是否有水。请参阅 从机柜卸下 DWC 托盘

  2. 如果歧管或快接件有漏液问题,请将其丢弃。然后,安装相应的新组件。请参阅:

  3. 更换新的漏液传感器。请参阅 更换漏液传感器

  4. 将所有组件装回机柜。然后,将电源线连接到所有机柜 PCS,并开启机柜电源。请参阅:

  5. 如果在上述步骤中无法确定问题,则可能需要联系产品工程师以获得进一步的帮助。

托盘漏液问题故障诊断

请按照顺序完成以下步骤,直至排除潜在漏水原因:

为本任务做好准备:
  1. 确保从所有 PCS 上拔下电源线。请参阅从所有电源管理转换站(PCS)上拔下电源线

  2. 请确保您手头有以下各项:

    1. 新的托盘漏液传感器(如果检测到漏液)

    2. 吸水布

  3. SMM3 消息报告托盘存在漏液问题。从机柜上卸下报告问题的托盘。此外,还要从机柜中卸下报告问题的托盘左右两侧的托盘。卸下托盘顶盖并检查水循环模块上是否有水。请参阅 卸下托盘外盖

  4. 必要时,请使用吸水布擦干潮湿的组件或托盘和机柜内部。

    在将组件装回托盘和机柜之前,请务必用手电筒目视检查机柜底部。
如果托盘漏液传感器异常或不存在:
  1. 检查托盘漏液传感器是否正确安装。要重新安装托盘漏液传感器,请参阅 更换漏液传感器模块

  2. 将所有组件装回机柜。然后,将电源线连接到所有机柜 PCS,并开启机柜电源。请参阅 SC750 V4 硬件更换过程

  3. 如果在上述步骤中无法确定问题,则可能需要联系产品工程师以获得进一步的帮助。

如果检测到托盘漏液:
  1. 如果水循环模块有漏液问题,请将其丢弃。然后,安装相应的新组件。请参阅 更换水循环模块

  2. 更换新的托盘漏液传感器。请参阅 更换漏液传感器模块

  3. 将所有组件装回机柜。然后,将电源线连接到所有机柜 PCS,并开启机柜电源。请参阅 SC750 V4 硬件更换过程

  4. 如果在上述步骤中无法确定问题,则可能需要联系产品工程师以获得进一步的帮助。

电源转换站(PCS)漏液问题故障诊断

请按照顺序完成以下步骤,直至排除潜在漏水原因:

  1. 确保从所有 PCS 上拔下电源线。请参阅从所有电源管理转换站(PCS)上拔下电源线

  2. 请确保您手头有以下各项:

    1. 新的电源管理转换站(PCS)

    2. 吸水布

  3. SMM3 消息报告 PCS 存在漏液问题。PCS LED 还会指示哪个 PCS 存在漏液问题(请参阅通过电源管理转换站(PCS)LED 行为识别漏液类型)。用新的 PCS 替换报告问题的 PCS。请参阅 更换电源转换站(PCS)

  4. 必要时,请使用吸水布擦干潮湿的组件或托盘内部。

    在将组件装回机柜之前,请务必用手电筒目视检查机柜底部。
  5. 将电源线连接到所有机柜 PCS,并开启机柜电源。请参阅 N1380 硬件更换过程

  6. 如果在上述步骤中无法确定问题,则可能需要联系产品工程师以获得进一步的帮助。

从所有电源管理转换站(PCS)上拔下电源线

在卸下组件以检查漏液情况之前,请务必从所有机柜电源管理转换站上拔下电源线。请务必拔下电源线至少两分钟,以避免 PCS 锁存。

请按照以下步骤从 PCS 上拔下电源线。
  1. 向外旋转电源插座滑锁。

  2. 从 PCS 上拔下电源线。

    图 1. 从 PCS 上拔下电源线