跳至主要内容

安裝後方 H100/H200 GPU

請依照本節中的指示安裝後方 H100/H200 GPU。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 將裝有元件的防靜電保護袋與伺服器上任何未上漆的金屬表面接觸;然後,從保護袋中取出元件,將它放在防靜電表面上。
  • 如果您手邊沒有扭矩螺絲起子,可以要求提供。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T10 螺絲起子
  • Torx T15 螺絲起子
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 平頭螺絲起子
  • 酒精清潔布
  • H100/H200 PCM 套件
  • SR780a V3 水迴路油灰墊套件
  • SR780a V3 水迴路維護套件
  • H100/H200 GPU 維修固定工具組
重要
油灰墊/相變材料 (PCM) 更換準則
  • 在更換油灰墊/PCM 之前,請使用酒精清潔布輕輕清潔硬體表面。
  • 小心握住油灰墊/PCM,以免變形。確保沒有任何螺絲孔或開口被油灰墊/PCM 堵塞。
  • 請勿使用過期的油灰墊/PCM。檢查油灰墊/PCM 包裝上的到期日。如果油灰墊/PCM 已過期,請購買新品以正確更換。
下圖顯示了 GPU 編號和 XCC 中對應的插槽編號。
圖 1. GPU 編號
GPU numbering

程序

  1. (選配)對於新的 GPU,請移除底部的接頭蓋。
    圖 2. 移除接頭蓋

  2. 輕輕地將 GPU 向下放在 GPU 基板上。
  3. 依照下圖中顯示順序鎖緊四個 Torx T15 螺絲,將 GPU 固定到 GPU 基板。
    首先將扭矩螺絲起子設定為 0.1-0.12 牛頓米、0.9-1.1 英吋磅,以鎖上螺絲幾輪。然後將扭矩螺絲起子設定為 0.58-0.62 牛頓米、5-5.5 英吋磅以完全鎖緊螺絲。
    圖 3. 安裝 GPU
    Installing the GPU
  4. 更換後方 GPU 水冷板上的相變材料 (PCM)。
    1. 從墊子的一側移除襯墊。
    2. 將 PCM 對齊水冷板底部的標記,並將其放在水冷板上;然後對 PCM 的整個表面區域以手指施壓以擠出任何殘留的空氣,並停留 1-2 分鐘的時間,直到其牢牢貼附。小心地移除剩餘的上襯。
      小心
      • PCM 不得重複使用。每次拆除水迴路時,都必須將 PCM 更換為新的。

      • 更換 PCM 後,在 GPU 恢復正常運作之前,預計會有一小段節流期間。這是由於 PCM 在更換後需要一段磨合期。

      • 更換 GPU PCM 和導熱墊後,維修人員必須執行 H100/H200 GPU PCM TIM 熔化程序,以監測 GPU 直到 PCM 熱介面材料 (TIM) 完全熔化。
      圖 4. 貼附 PCM

      PCM application
  5. 更換 GPU 上的油灰墊 (x5)。
    1. 從墊子的一側移除襯墊。
    2. 確保將油灰墊對齊 GPU VR (1) 和 GPU 上的標記,然後將油灰墊放在 GPU 上,並對油灰墊的整個表面區域以手指輕輕施壓,使其確實黏附。小心地移除剩餘的上襯。
      小心
      • 油灰墊不得重複使用。每次拆除水迴路時,都必須將油灰墊更換為新的。
      • 更換 GPU PCM 和導熱墊後,維修人員必須執行 H100/H200 GPU PCM TIM 熔化程序,以監測 GPU 直到 PCM 熱介面材料 (TIM) 完全熔化。
      圖 5. 更換 GPU 油灰墊
      GPU putty pads replacement
      1 GPU VR(用油灰墊覆蓋 GPU VR)
  6. 從歧管移除維修托架和 GPU 水冷板組件。
    1. 鬆開將維修托架固定到歧管的緊固螺絲。
    2. 將維修托架和 GPU 水冷板組件從歧管上抬起以將其卸下。
      圖 6. 卸下維修托架和 GPU 水冷板組件
      Removing the service bracket and the GPU cold plate assembly
  7. 將水冷板放在 GPU 上。
    1. 翻轉維修托架和 GPU 水冷板組件,然後輕輕地將 GPU 水冷板放在 GPU 上。
    2. 調整水冷板,直到兩個導件插腳固定在 GPU 上的導孔中。
      圖 7. 調整水冷板
      Adjusting the cold plate
  8. 鬆開緊固螺絲,將維修托架從水冷板上卸下。
    1. 鬆開將維修托架固定到 GPU 水冷板的緊固螺絲。
    2. 將維修托架從 GPU 水冷板上抬起以將其卸下。
      圖 8. 卸下維修托架
      Removing the service bracket
  9. 使用 H100/H200 GPU 維修固定工具組來安裝水冷板。下圖顯示了 H100/H200 GPU 維修固定工具的組件。
    圖 9. H100/H200 GPU 維修固定工具組件識別
    H100/H200 GPU service fixture components identification
    表 1. H100/H200 GPU 維修固定工具
    1 H100/H200 GPU 維修固定工具2 把手
    3 夾頭4 墊片
    5 後方 GPU 水冷板桌面6 前方 GPU 水冷板桌面
  10. 將 H100/H200 GPU 維修固定工具安裝到後方 GPU 水冷板。將固定裝置上標有「後方」的導槽與機箱上的導件插腳對齊,然後小心地將固定裝置安裝在機箱。鎖緊六個 M3 螺絲 (C3/P2/P3) (PH2,6 x M3,0.7 牛頓米,6 吋磅),將固定裝置固定到機箱。
    圖 10. 將固定裝置安裝到後方 GPU 水冷板

    Installing fixture to the rear GPU cold plates
  11. 使用 5 公釐六角起子頭螺絲起子,透過鬆開和鎖緊四顆六角螺絲(4 x M6,0.7 牛頓米, 6 吋磅),調整把手和夾頭組件的位置。
    圖 11. 調整把手
    Adjusting handle
  12. 調整把手和夾頭組件後,將四顆六角螺絲(4 x M6,0.7 牛頓米,6 吋磅)重新鎖回固定裝置上。
    圖 12. 重新安裝螺絲
    Reattaching screws
  13. 將支架與水冷板上的四顆螺絲對齊,然後小心地將其放置在水冷板上,確保「FRONT」標示朝向機箱前方,如圖所示。在放置桌面之前,請確保所有感應器纜線和軟管已移至一旁,不會妨礙操作。
    重要
    • 確保感應器纜線或軟路未被夾在桌面與水冷板之間。

    • 確保「FRONT」標誌朝向機箱的前方。

    圖 13. 放置桌面
    Placing the table
  14. 調整夾頭。
    1. 鬆開拉桿頂部的六角螺帽。
    2. 鬆開拉桿底部的六角螺帽。
      圖 14. 鬆開夾頭上的螺絲
      Loosening the screws on the clamp head
    3. 將把手向前推到稍微伸直的位置。如圖所示,調整夾頭,使其位於桌面的中心。
    4. 鎖緊拉桿底部的六角螺帽。
    5. 將六角螺帽套筒起子頭連接到螺絲起子上。用一隻手將夾頭固定到位;然後,使用螺絲起子鎖緊拉桿頂部的六角螺帽。
      圖 15. 調整夾頭
      Adjusting the clamp head
  15. 將墊片放置在夾頭上,並在將把手拉至完全伸直的位置時握住墊片。
    圖 16. 拉動把手
    Pulling the handle
  16. 將 T10 延長起子頭連接到扭矩螺絲起子。遵循固定裝置和水冷板標籤上指定的螺絲順序,然後重複上述步驟,使用設定為適當扭矩的扭矩螺絲起子完全鎖緊十六顆 Torx T10 螺絲。
    1. 將扭矩螺絲起子設定為 0.4±0.05 牛頓米、3.5±0.5 磅英吋。
    2. 依照螺絲安裝順序鎖緊螺絲 720 度:
      請務必遵循螺絲安裝順序,以防止 GPU 水冷板傾斜。
    3. 重複上述步驟,直到 GPU 水冷板上的所有螺絲完全鎖緊。
    圖 17. 重複上述步驟以完全鎖緊所有螺絲
    Repeat to fully tighten all the screws
    圖 18. GPU 水冷板螺絲擰緊順序
    GPU cold plate screw tightening sequence
    圖 19. 安裝 GPU 水冷板
    Installing the GPU cold plates
  17. 使用固定裝置鎖緊螺絲後,卸下桌面並重新調整螺絲的扭力。使用設定為 0.4±0.05 牛頓米、3.5±0.5 磅吋的 Torx T10 螺絲起子,遵循螺絲安裝順序 重新調整水冷板上螺絲的扭力。
    先卸下桌面,再重新調整扭力。
    圖 20. 重新調整水冷板螺絲的扭力
    Re-torque the cold plate screws
  18. 安裝水冷板後,從機箱卸下 H100/H200 GPU 維修固定工具組。
  19. 將洩漏感應器模組纜線重新安裝到 GPU 水冷板。
    1. 從相鄰的纜線夾移除洩漏感應器模組纜線。
    2. 將洩漏感應器模組纜線佈放回 GPU 水冷板,然後將其安裝在水冷板上的纜線夾中。
      圖 21. 安裝洩漏感應器模組纜線
      Installing the leakage sensor module cable

在您完成之後

  1. 重新連接已拔掉的所有纜線。請參閱內部纜線佈線
  2. 重新安裝電源複合體。請參閱安裝電源複合體
  3. 重新安裝 CPU 複合體。請參閱安裝 CPU 複合體
  4. 重新安裝風扇機盒。請參閱安裝風扇機盒(僅限經過培訓的維修技術人員)
  5. 重新安裝後方上蓋。請參閱安裝後方上蓋
  6. 重新安裝前方上蓋。請參閱安裝前方上蓋
  7. 完成零件更換。請參閱完成零件更換