跳到主要内容

安装 GPU(仅限经过培训的技术人员)

按以下信息安装 GPU。

关于本任务

必备工具

请确保您手头有下列必备工具,以便妥善更换组件。

  • SD665-N V3 Water Loop Service Kit (维护套件中的水循环模块载板可重复使用,建议将其留在服务器运行的场所,以备将来更换时使用。)

  • SD665-N V3 Water Loop Putty Pad Kit

  • SD665-N V3 SXM5 PCM Fixture

  • SXM5 PCM Kit (用于从 GPU 上卸下 PCM)

  • 螺钉和螺丝刀

    为确保可以正确安装和卸下相应的螺钉,请准备好以下螺丝刀。
    螺丝刀类型螺钉类型
    六角螺丝刀6 毫米六角螺丝刀
    T10 内六角螺丝刀T10 内六角螺钉
    1 号十字螺丝刀1 号十字螺钉
    2 号十字螺丝刀2 号十字螺钉
注意
  • 请阅读安装准则安全检查核对表以确保操作安全。

  • 关闭要执行任务的相应 DWC 托盘。

  • 从机柜上拔下所有外部线缆。

  • 如果 QSFP 线缆已连接至解决方案,请用力将这些线缆拔下。

  • 为避免损坏水循环模块,卸下、安装或折叠水循环模块时请始终使用水循环模块载板。

  • 如果您手头没有力矩螺丝刀,可以向我们申请提供。

下图显示了 GPU 编号。
图 1. GPU 编号
GPU numbering
重要
间隙垫/油灰垫更换准则
  • 要确定间隙垫/油灰垫的位置和方向,请参阅间隙垫/油灰垫的标识和位置

  • 在更换间隙垫/油灰垫之前,请使用酒精清洁垫轻轻地清洁接口板或硬件表面。

  • 小心地握住间隙垫/油灰垫,以免变形。确保间隙垫/油灰垫材料不会遮挡螺钉孔或开口。

  • 请勿使用过期的油灰垫。检查油灰垫包装上的有效期。如果油灰垫过期,请购买新的油灰垫以进行妥善更换。

固件和驱动程序下载:更换组件后,可能需要更新固件或驱动程序。

过程

确保检查 GPU 和 GPU 板上的接口和插槽。如果 GPU 或 GPU 板的接口损坏或缺失,或者插槽中有碎屑,请勿使用相应的 GPU 或 GPU 板。在继续安装过程之前,请更换新的 GPU 或 GPU 板。

  1. 轻轻将 GPU 向下放在 GPU 板上,然后使用设置到适当扭矩的扭矩螺丝刀安装四颗内六角 T15 螺钉。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 0.45-0.56 牛·米,即 4.0-5.0 磅·英寸。
    图 2. 安装 GPU

    图 3. GPU 螺钉拧紧顺序
    GPU screw tightening sequence

请确保遵循间隙垫/油灰垫更换准则

  1. 将 GPU 节点水循环模块上的相变材料(PCM)和油灰垫更换为新的 PCM 和油灰垫。
    1. 将 PCM 夹具安装到 GPU 冷却板上。
    2. 将 PCM 连接到夹具的方形开口。
    3. 重复操作以更换所有四个 GPU 冷却板的 PCM。
      图 4. 更换水循环模块 GPU 冷却板 PCM(GPU 节点)
      Water loop GPU cold plate PCM replacement
    4. 更换 GPU 节点水循环模块上的油灰垫。
      图 5. 更换水循环模块油灰垫(GPU 节点)
      Putty pads on the GPU node water loop putty pads replacement
    5. 更换 GPU 上的油灰垫(5 个)。确保将油灰垫对齐到 GPU VR(1)以及 GPU 上的标记。重复操作以更换四个 GPU 上的所有油灰垫。
      1 GPU VR(使用油灰垫覆盖 GPU VR)
      图 6. 更换 GPU 油灰垫
      GPU putty pads replacement

请确保遵循间隙垫/油灰垫更换准则

  1. 展开水循环模块并将其放置到 GPU 节点上。
    图 7. 将水循环模块展开到 GPU 节点上
    Unfolding the water loop to GPU node
  2. 拧松水循环模块载板螺钉(20 颗 2 号十字螺钉)。
    图 8. 安装水循环模块螺钉和快接件螺钉(GPU 节点)
    Water loop screws and quick connect screws installation (GPU node)
  3. 从 GPU 节点上卸下水循环模块载板。
    图 9. 卸下水循环模块载板(GPU 节点)
    Water loop carrier removal (GPU node)
  4. 安装 GPU 冷却板螺钉(16 颗 PH2 螺钉)。按对角线顺序安装 GPU 冷却板。完成 GPU 2 螺钉的安装,然后继续安装 GPU 4 > GPU 1 > GPU 3 的螺钉。
    1. 将扭矩螺丝刀设置为 3.5 磅·英寸,即 0.39 牛·米。
    2. 按照螺钉安装顺序将螺钉拧紧 720 度:
      确保遵循螺钉安装顺序,以免 GPU 冷却板倾斜。
    3. 重复操作,直到四个 GPU 冷却板上的所有螺钉完全拧紧
    图 10. 安装 GPU 冷却板螺钉
    GPU cold plate screw installation
  5. 按照网卡标签上指定的螺钉安装顺序,使用设置到适当扭矩的扭矩螺丝刀安装网络冷却板螺钉(8 颗 T10 内六角螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 11. 安装网卡螺钉
    Network card screw installation
  6. 使用设置到适当扭矩的扭矩螺丝刀,安装快接件螺钉(4 颗 T10 内六角螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 12. 安装快接件螺钉(GPU 节点)
    Quick connect screw installation (GPU node)
  7. 使用设置到适当扭矩的扭矩螺丝刀,安装水循环模块螺钉和快接件螺钉(13 颗 T10 内六角螺钉)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 13. 安装水循环模块 T10 内六角螺钉(GPU 节点)
    Water loop Torx T10 screws installation (GPU node)
  8. 安装六角螺钉(1 颗)和 PH1 螺钉(3 颗)。
    (供参考)将螺钉完全拧紧或卸下所需的扭矩为 5.0+/- 0.5 磅·英寸,即 0.55+/- 0.05 牛·米。
    图 14. 安装水循环模块六角螺钉和 PH1 螺钉(GPU 节点)
    Water loop Hex and PH1 screws installation (GPU node)
  9. 将线缆扎带安装到 GPU 板。
    图 15. 安装线缆扎带
    Installing the cable tie
  10. 连接载板电源线。
    图 16. 连接载板电源线
    Connecting carrier board power cable
    线缆从(载板)到(GPU 节点配电板)
    1 载板电源线电源和边带接口电源接口
完成之后
  1. 安装 MCIO 线缆。请遵循内部线缆布放中的指导信息和布线信息。

  2. 安装汇流条。请参阅安装汇流条

  3. 安装横梁。请参阅安装横梁

  4. 安装托盘外盖。请参阅安装托盘外盖

  5. 将托盘装入机柜。请参阅在机柜中安装 DWC 托盘

  6. 将所有需要的外部线缆连接到解决方案。
    用力将 QSFP 线缆连接到解决方案。
  7. 检查各节点上的电源 LED,确保其从快速闪烁转变为缓慢闪烁,表示所有节点已准备好打开电源。

演示视频

在 YouTube 上观看操作过程