跳至主要内容

安裝後方 H100/H200 GPU 水冷板模組

請依照本節中的指示安裝後方 H100/H200 GPU 水冷板模組。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 將裝有元件的防靜電保護袋與伺服器上任何未上漆的金屬表面接觸;然後,從保護袋中取出元件,將它放在防靜電表面上。
  • 如果您手邊沒有扭矩螺絲起子,可以要求提供。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T10 螺絲起子
  • Torx T15 螺絲起子
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 平頭螺絲起子
  • 酒精清潔布
  • H100/H200 PCM 套件
  • SR780a V3 水迴路油灰墊套件
  • SR780a V3 水迴路維護套件
  • H100/H200 GPU 維修固定工具組
重要
油灰墊/相變材料 (PCM) 更換準則
  • 在更換油灰墊/PCM 之前,請使用酒精清潔布輕輕清潔硬體表面。
  • 小心握住油灰墊/PCM,以免變形。確保沒有任何螺絲孔或開口被油灰墊/PCM 堵塞。
  • 請勿使用過期的油灰墊/PCM。檢查油灰墊/PCM 包裝上的到期日。如果油灰墊/PCM 已過期,請購買新品以正確更換。
下圖顯示了 GPU 編號和 XCC 中對應的插槽編號。
圖 1. GPU 編號
GPU numbering
下圖顯示後方 H100/H200 GPU 水冷板模組的元件。
圖 2. 後方 H100/H200 GPU 水冷板模組元件識別
Rear H100/H200 GPU cold plate module components identification
表 1. 後方 H100/H200 GPU 水冷板模組元件
1 歧管2 軟管束帶
3 洩漏感應器模組4 出貨托架
5 GPU 水冷板6 GPU 插槽號碼標籤
7 GPU 水冷板螺絲扭矩標籤 

程序

  1. 確保 GPU 複合體已安裝在機箱中。
  2. 更換後方 H100/H200 GPU 水冷板模組上的相變材料。
    1. 從墊子的一側移除襯墊。
    2. 將 PCM 對齊水冷板底部的標記,並將其放在水冷板上;然後對 PCM 的整個表面區域以手指施壓以擠出任何殘留的空氣,並停留 1-2 分鐘的時間,直到其牢牢貼附。小心地移除剩餘的上襯。
    3. 重複上述步驟,更換四個水冷板上的 PCM。
      小心
      • PCM 不得重複使用。每次拆除水迴路時,都必須將 PCM 更換為新的。

      • 更換 PCM 後,在 GPU 恢復正常運作之前,預計會有一小段節流期間。這是由於 PCM 在更換後需要一段磨合期。

      • 更換 GPU PCM 和導熱墊後,維修人員必須執行 H100/H200 GPU PCM TIM 熔化程序,以監測 GPU 直到 PCM 熱介面材料 (TIM) 完全熔化。
      圖 3. 貼附 PCM
      PCM application
  3. 更換 GPU 上的油灰墊 (x5)。
    1. 從墊子的一側移除襯墊。
    2. 確保將油灰墊對齊 GPU VR (1) 和 GPU 上的標記,然後將油灰墊放在 GPU 上,並對油灰墊的整個表面區域以手指輕輕施壓,使其確實黏附。小心地移除剩餘的上襯。
    3. 重複上述步驟,更換四個 GPU 上的所有油灰墊。
      小心
      • 油灰墊不得重複使用。每次拆除水迴路時,都必須將油灰墊更換為新的。
      • 更換 GPU PCM 和導熱墊後,維修人員必須執行 H100/H200 GPU PCM TIM 熔化程序,以監測 GPU 直到 PCM 熱介面材料 (TIM) 完全熔化。
      圖 4. 更換 GPU 油灰墊
      GPU putty pads replacement
      1 GPU VR(用油灰墊覆蓋 GPU VR)
  4. 安裝後方 H100/H200 GPU 水冷板模組。
    1. 握住後方 H100/H200 GPU 水冷板模組的出貨托架,然後將歧管上的導槽對齊標有 A 的導件插腳,並輕輕地將水冷板模組放在四個後方 GPU 上。
    2. 確保歧管上的導槽與機箱上標有 A 的導件插腳牢固嚙合。
      圖 5. 安裝後方 H100/H200 GPU 水冷板模組
      Installing the rear H100/H200 GPU cold plate module
  5. 鬆開將出貨托架固定到後方 H100/H200 GPU 水冷板模組的六個緊固螺絲,然後從後方 H100/H200 GPU 水冷板模組卸下出貨托架。
    圖 6. 卸下出貨托架
    Removing the shipping brackets
  6. 調整水冷板,直到兩個導件插腳固定在 GPU 上的導孔中。重複上述步驟,調整四個水冷板。
    圖 7. 調整 GPU 水冷板
    Adjusting the GPU cold plates
  7. 使用 H100/H200 GPU 維修固定工具組來安裝水冷板。下圖顯示了 H100/H200 GPU 維修固定工具的組件。
    圖 8. H100/H200 GPU 維修固定工具組件識別
    H100/H200 GPU service fixture components identification
    表 2. H100/H200 GPU 維修固定工具
    1 H100/H200 GPU 維修固定工具2 把手
    3 夾頭4 墊片
    5 後方 GPU 水冷板桌面6 前方 GPU 水冷板桌面
  8. 將 H100/H200 GPU 維修固定工具安裝到後方 GPU 水冷板。將固定裝置上標有「後方」的導槽與機箱上的導件插腳對齊,然後小心地將固定裝置安裝在機箱。鎖緊六個 M3 螺絲 (C3/P2/P3) (PH2,6 x M3,0.7 牛頓米,6 吋磅),將固定裝置固定到機箱。
    圖 9. 將固定裝置安裝到後方 GPU 水冷板

    Installing fixture to the rear GPU cold plates
  9. 將支架與水冷板上的四顆螺絲對齊,然後小心地將其放置在水冷板上,確保「FRONT」標示朝向機箱前方,如圖所示。在放置桌面之前,請確保所有感應器纜線和軟管已移至一旁,不會妨礙操作。
    重要
    • 確保感應器纜線或軟路未被夾在桌面與水冷板之間。

    • 確保「FRONT」標誌朝向機箱的前方。

    圖 10. 放置桌面
    Placing the table
  10. 調整夾頭。
    1. 鬆開拉桿頂部的六角螺帽。
    2. 鬆開拉桿底部的六角螺帽。
      圖 11. 鬆開夾頭上的螺絲
      Loosening the screws on the clamp head
    3. 將把手向前推到稍微伸直的位置。如圖所示,調整夾頭,使其位於桌面的中心。
    4. 鎖緊拉桿底部的六角螺帽。
    5. 將六角螺帽套筒起子頭連接到螺絲起子上。用一隻手將夾頭固定到位;然後,使用螺絲起子鎖緊拉桿頂部的六角螺帽。
      圖 12. 調整夾頭
      Adjusting the clamp head
  11. 將墊片放置在夾頭上,並在將把手拉至完全伸直的位置時握住墊片。
    圖 13. 拉動把手
    Pulling the handle
  12. 將 T10 延長起子頭連接到扭矩螺絲起子。遵循固定裝置和水冷板標籤上指定的螺絲順序,然後重複上述步驟,使用設定為適當扭矩的扭矩螺絲起子完全鎖緊十六顆 Torx T10 螺絲。
    1. 將扭矩螺絲起子設定為 0.4±0.05 牛頓米、3.5±0.5 磅英吋。
    2. 依照螺絲安裝順序鎖緊螺絲 720 度:
      請務必遵循螺絲安裝順序,以防止 GPU 水冷板傾斜。
    3. 重複上述步驟,直到 GPU 水冷板上的所有螺絲完全鎖緊。
    圖 14. 重複上述步驟以完全鎖緊所有螺絲
    Repeat to fully tighten all the screws
    圖 15. GPU 水冷板螺絲擰緊順序
    GPU cold plate screw tightening sequence
    圖 16. 安裝 GPU 水冷板
    Installing the GPU cold plates
  13. 使用固定裝置鎖緊螺絲後,卸下桌面並重新調整螺絲的扭力。使用設定為 0.4±0.05 牛頓米、3.5±0.5 磅吋的 Torx T10 螺絲起子,遵循螺絲安裝順序 重新調整水冷板上螺絲的扭力。
    圖 17. 重新調整水冷板螺絲的扭力
    Re-torque the cold plate screws
  14. 使用 5 公釐六角起子頭螺絲起子,透過鬆開和鎖緊四顆六角螺絲(4 x M6,0.7 牛頓米, 6 吋磅),調整把手和夾頭組件的位置。從步驟 10 到步驟 14 重複,直到安裝所有四個水冷板。
    圖 18. 調整把手
    Adjusting handle
  15. 調整把手和夾頭組件後,將四顆六角螺絲(4 x M6,0.7 牛頓米,6 吋磅)重新鎖回固定裝置上。
    圖 19. 重新安裝螺絲
    Reattaching screws
  16. 在安裝完成所有水冷板後,從機箱卸下 H100/H200 GPU 維修固定工具組。
  17. 下圖顯示了水管固定器的位置。
    圖 20. 水管固定器位置
    Hose holder location
  18. 將軟管放在水管導管和水管固定器上。
    1. 將後方 H100/H200 GPU 水冷板模組軟管和纜線放在軟管導管上,並用軟管束帶將其固定。請參閱風扇控制板纜線佈線洩漏感應器模組纜線佈線
      圖 21. 用軟管束帶固定軟管和纜線
      Securing the hoses and cables with hose ties
    2. 將左側後方 H100/H200 GPU 水冷板模組軟管放在 (1) 水管固定器 C 上,將右側後方 H100/H200 GPU 水冷板模組軟管放在 (2) 水管固定器 B 上。確保軟管上的導向標籤與水管固定器上的標記相符。
      圖 22. 將軟管放在水管固定器上
      Placing the hoses on hose holders
      1 水管固定器 C(左側)2 水管固定器 B(右側)
      重要
      • 安裝前檢查水管和水管固定器上的導向標籤。

  19. 如圖所示,重新放置後方 H100/H200 GPU 水冷板模組歧管。
    1. 將歧管與標有 A 的導件插腳分離,然後將歧管移動到標有 B 的導件插腳。
    2. 確保歧管托架上的導槽與標有 B 的導件插腳牢固嚙合。
      圖 23. 重新放置後方 H100/H200 GPU 水冷板模組歧管
      Repositioning the rear H100/H200 GPU cold plate module manifold
  20. 鎖緊四個 M3 螺絲 (W7-W8)(PH2、4 x M3、0.5 牛頓米、4.3 英吋磅),將後方 H100/H200 GPU 水冷板模組歧管固定到機箱。
    圖 24. 安裝後方 H100/H200 GPU 水冷板模組歧管
    Installing the rear H100/H200 GPU cold plate module manifold
  21. 如果您要在安裝新的 GPU 複合體後安裝後方 H100/H200 GPU 水冷板模組,請確定已安裝 NVSwitch 水冷板模組和前方 H100/H200 GPU 水冷板模組,之後才安裝後方風扇機盒支撐托架。
  22. 安裝後方風扇機盒支撐托架。
    1. 將後方風扇機盒支撐托架對齊對應的螺絲孔,然後如圖所示,將後風扇機盒支撐托架安裝在水管固定器 B/C 的頂部。
    2. 鎖緊四個 M3 螺絲(PH2、4 x M3、0.5 牛頓米、4.3 英吋磅),將後方風扇機盒支撐托架固定到風扇機盒。
    3. 鎖緊八個 M3 螺絲(PH2、8 x M3、0.5 牛頓米、4.3 英吋磅),將後方風扇機盒支撐托架固定到機箱。
      圖 25. 安裝後方風扇機盒支撐托架
      Installing the rear fan cage support bracket

在您完成之後

  1. 重新連接已拔掉的所有纜線。請參閱內部纜線佈線
  2. 重新安裝電源複合體。請參閱安裝電源複合體
  3. 重新安裝 CPU 複合體。請參閱安裝 CPU 複合體
  4. 重新安裝風扇機盒。請參閱安裝風扇機盒(僅限經過培訓的維修技術人員)
  5. 重新安裝後方上蓋。請參閱安裝後方上蓋
  6. 重新安裝前方上蓋。請參閱安裝前方上蓋
  7. 完成零件更換。請參閱完成零件更換