跳到主要内容

卸下 GPU 配电板(仅限经过培训的技术人员)

按以下信息卸下 GPU 配电板。

关于本任务

必备工具

请确保您手头有下列必备工具,以便妥善更换组件。

  • SD665-N V3 Water Loop Service Kit (维护套件中的水循环模块载板可重复使用,建议将其留在服务器运行的场所,以备将来更换时使用。)

  • SD665-N V3 Water Loop Putty Pad Kit

  • SD665-N V3 SXM5 PCM Fixture

  • SXM5 PCM Kit (用于从 GPU 上卸下 PCM)

  • 螺钉和螺丝刀

    为确保可以正确安装和卸下相应的螺钉,请准备好以下螺丝刀。
    螺钉类型螺丝刀类型
    六角螺钉(GPU 节点水循环模块)6 毫米六角螺丝刀
    六角螺钉(OSFP 模块导电板)4.5 毫米六角螺丝刀
    T10 内六角螺钉T10 内六角螺丝刀
    1 号十字螺钉1 号十字螺丝刀
    2 号十字螺钉2 号十字螺丝刀
警告

SD665-N V3 GPU 配电板操作准则

在操作 GPU 配电板时,请确保遵循以下准则:
  • 轻拿轻放配电板;不要对配电板施力过度。

  • 需要搁置 GPU 配电板时,请将其倒扣 在平面上。

  • 如果 GPU 配电板掉落,请丢弃。

  • 操作 GPU 配电板时,请确保握持电源接口和电源线接头,如下所示。请勿触碰配电板的任何其他位置。
    图 1. SD665-N V3 GPU 配电板操作点
    SD665-N V3 GPU power distribution board touch points
注意
  • 请阅读安装准则安全检查核对表以确保操作安全。

  • 关闭要执行任务的相应 DWC 托盘。

  • 从机柜上拔下所有外部线缆。

  • 如果 QSFP 线缆已连接至解决方案,请用力将这些线缆拔下。

  • 为避免损坏水循环模块,卸下、安装或折叠水循环模块时请始终使用水循环模块载板。

  • 如果您手头没有力矩螺丝刀,可以向我们申请提供。

过程

  1. 为本任务做好准备。
    1. 从机柜上卸下托盘。请参阅从机柜卸下 DWC 托盘
    2. 卸下托盘外盖。请参阅卸下托盘外盖
    3. 卸下横梁。请参阅卸下横梁
    4. 卸下汇流条。请参阅卸下汇流条
    5. 拔下 MCIO 线缆。请遵循内部线缆布放中的指导信息和布线信息。
  2. 从 GPU 节点上拔下载板电源线。
    图 2. 拔下载板电源线
    Carrier board power cable removal
    线缆从(载板)到(GPU 节点配电板)
    1 载板电源线电源和边带接口电源接口
  3. 从 GPU 板上取下线缆扎带。
    图 3. 取下线缆扎带
    Cable tie removal
  4. 使用设置到适当扭矩的扭矩螺丝刀,从水循环模块上卸下六角螺钉(1 颗)和 PH1 螺钉(3 颗)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 4. 卸下水循环模块六角螺钉和 PH1 螺钉(GPU 节点)
    Water loop Hex and PH1 screws removal (GPU node)
  5. 使用设置到适当扭矩的扭矩螺丝刀,卸下水循环模块螺钉和快接件螺钉(13 颗 T10 内六角螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 5. 卸下水循环模块 T10 内六角螺钉(GPU 节点)
    Water loop Torx T10 screws removal (GPU node)
  6. 使用设置到适当扭矩的扭矩螺丝刀,卸下快接件螺钉(4 颗 T10 内六角螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 6. 卸下快接件螺钉(GPU 节点)
    Quick connect screw removal (GPU node)
  7. 按照网卡标签上指定的螺钉卸下顺序,使用设置到适当扭矩的扭矩螺丝刀卸下网络冷却板螺钉(8 颗 T10 内六角螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 7. 卸下网卡螺钉
    Network card screws removal
  8. 使用设置到适当扭矩的扭矩螺丝刀,按对角线顺序拧松 GPU 冷却板螺钉(16 颗内六角 T10 螺钉)。
    (供参考)将螺钉完全拧紧或拧松所需的扭矩为 0.4+/-0.05 牛·米,即 3.5+/-0.5 磅·英寸。
    图 8. 拧松 GPU 冷却板螺钉
    Loosening GPU cold plate screw removal
  9. 从 GPU 板上松开水循环模块的正面和背面 MISC 导电板。
    1. 将平头螺丝刀插入 MISC 导电板(正面和背面)和 GPU 板之间的间隙。然后,稍微旋转平头螺丝刀。
      插入平头螺丝刀的间隙位置如下图所示。
    2. 正面和背面 MISC 导电板与 GPU 板轻微松开。
      图 9. 从 GPU 板上松开正面和背面 MISC 导电板
      Releasing the front and rear MISC conduction plates release from the GPU board
  10. 从 GPU 上松开 GPU 冷却板。
    1. GPU 冷却板侧面有槽口可以插入平头螺丝刀。槽口的位置如下图所示。
      注意
      只能将平头螺丝刀插入到下图中圈出的槽口。否则,螺丝刀可能会损坏 GPU。
      图 10. 用于松开 GPU 冷却板的槽口
      Notches for releasing GPU cold plates
    2. 将平头螺丝刀插入图中所示的所有槽口;然后,稍微旋转螺丝刀,将 GPU 冷却板从 GPU 上松开。
      图 11. 从 GPU 上松开 GPU 冷却板
      Releasing the GPU cold plate from the GPU
  11. 轻轻地将水循环模块载板向下放到水循环模块上,确保其在水循环模块上牢固就位。
    图 12. 安装水循环模块载板(GPU 节点)
    Water loop carrier installation (GPU node)
  12. 使用设置到适当扭矩的扭矩螺丝刀,拧紧水循环模块载板螺钉(20 颗 2 号十字螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 13. 卸下水循环模块螺钉和快接件螺钉(GPU 节点)
    Water loop screw and quick connect screw removal (GPU node)
  13. 小心地翻转水循环模块,使一半模块位于另一半之上。
    图 14. 将 GPU 节点侧水循环模块折叠到计算节点侧水循环模块上
    Folding the GPU node side water loop onto the Compute node side water loop
  14. 立即使用酒精清洁垫清除所有 GPU 上的 PCM。轻轻擦除 PCM,以免损坏 GPU。
    注意
    • 建议在 PCM 处于液态时进行清洁。

    • GPU 芯片周围的电气元件极其精密。卸下 PCM 并清洁 GPU 芯片时,不要接触电气元件,以免损坏。

    图 15. 清除所有 GPU 上的 PCM
    Cleaning PCM off from all GPUs
  15. 使用酒精清洁垫擦除 GPU 节点内水循环模块和组件上残留的油灰垫和 PCM。
    图 16. 清除水循环模块上的油灰垫
    Cleaning putty pads from water loop
  16. 卸下 GPU 配电板上的两颗螺钉。
    图 17. 卸下 GPU 配电板螺钉
    GPU power distribution board screw removal
  17. 将 GPU 配电板从节点中取出。
    操作 GPU 配电板时,请务必遵循 SD665-N V3 GPU 配电板操作准则
    图 18. 卸下 GPU 配电板
    Removing the GPU power distribution board
完成之后

如果要求您退回组件或可选设备,请按照所有包装指示信息进行操作,并使用装运时提供给您的所有包装材料。

演示视频

在 YouTube 上观看操作过程