跳至主要内容

安裝前方 B200 GPU

請依照本節中的指示安裝前方 B200 GPU。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 將裝有元件的防靜電保護袋與伺服器上任何未上漆的金屬表面接觸;然後,從保護袋中取出元件,將它放在防靜電表面上。
  • 如果您手邊沒有扭矩螺絲起子,可以要求提供。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T15 螺絲起子
  • 2 x Torx T15 200 公釐延長起子頭
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 酒精清潔布
  • B200 PCM
  • B200 SXM6 PAD-1
  • B200 SXM6 PAD-2
  • B200 GPU 維修套件
B200(GPU 和重定時器 NVSwitch)(維修和出貨托架)套件可重複使用,在維修 GPU 和 GPU 水冷板模組時是必要的工具。建議將它們保存在伺服器運作的設施中,以備將來更換需要。
重要
油灰墊/相變材料 (PCM) 更換準則
  • 在更換油灰墊/PCM 之前,請使用酒精清潔布輕輕清潔硬體表面。
  • 小心握住油灰墊/PCM,以免變形。確保沒有任何螺絲孔或開口被油灰墊/PCM 堵塞。
  • 請勿使用過期的油灰墊/PCM。檢查油灰墊/PCM 包裝上的到期日。如果油灰墊/PCM 已過期,請購買新品以正確更換。
下圖顯示了 B200 GPU 編號和 XCC 中對應的插槽編號。
圖 1. B200 GPU 編號
B200 GPU numbering
實體 GPU 插座XCC 中的插槽編號nvidia-smi 中的邏輯編號

GPU 1

插槽 21

4

GPU 2

插槽 24

7

GPU 3

插槽 22

5

GPU 4

插槽 23

6

GPU 5

插槽 17

0

GPU 6

插槽 20

3

GPU 7

插槽 18

1

GPU 8

插槽 19

2

程序

  1. (選配)對於新的 GPU,請移除底部的接頭蓋。
    圖 2. 移除接頭蓋
    Removing connector covers
  2. 安裝 GPU。
    1. 沿對角線安裝兩個 GPU 螺絲把手。將螺絲把手對齊水冷板螺絲孔;然後,用手鎖緊螺絲把手。
      圖 3. 安裝 GPU 螺絲把手
      Installing the GPU screw handles
    2. 握住 GPU 螺絲把手,小心地將 GPU 放在 GPU 基板上。
      圖 4. 安裝 GPU
      Installing the GPU
    3. 用手鬆開兩個螺絲把手,將其卸下。
      圖 5. 卸下 GPU 螺絲把手
      Removing the GPU screw handles
    4. 將兩個 Torx T15 200 公釐延長起子頭連接到兩個扭矩螺絲起子。使用設定為適當扭矩的螺絲起子,同時鎖緊兩個對角 Torx T15 螺絲。
    5. 首先將扭矩螺絲起子設定為 0.11±0.011 牛頓米、0.97±0.097 英吋磅,以同時鎖緊兩個對角 螺絲;然後,同時鎖緊兩個對角 螺絲。
    6. 然後將扭矩螺絲起子設定為 0.6±0.024 牛頓米、5.3±0.212 英吋磅,以同時鎖緊兩個對角 螺絲;然後,同時鎖緊兩個對角 螺絲。
      圖 6. 安裝 GPU
      Installing the GPU
  3. 更換 GPU 水冷板上的相變材料 (PCM)。
    1. 將 PCM 夾具貼附到 GPU 水冷板。
    2. 從墊子的一側移除襯墊。將 PCM 與夾具對齊,並將其放在水冷板上。卸下夾具;然後,對 PCM 的整個表面區域以手指施壓以擠出任何殘留的空氣,並停留 1-2 分鐘的時間,直到其牢牢貼附。小心地移除剩餘的上襯。
      小心
      • PCM 不得重複使用。每次拆除水迴路時,都必須將 PCM 更換為新的。

      圖 7. 貼附 PCM

      PCM application
  4. 更換 GPU 上的油灰墊 (x10)。
    1. 請依照 B200 GPU 貼附指示貼附油灰墊。
      • 將 B200 SXM6 PAD-1 的油灰墊貼附到標有數字 1 的六個位置
      • 將 B200 SXM6 PAD-1 的油灰墊貼附到標有數字 2 的兩個位置
      • 將 B200 SXM6 PAD-2 的油灰墊貼附到 GPU VR 上標有數字 3 和 4(灰色)的兩個位置
      圖 8. GPU 油灰墊指示
      GPU putty pads instructions
    2. 從墊子的一側移除襯墊。
    3. 請務必將兩個灰色油灰墊對齊 GPU VR (1) 和標記;然後,如圖所示,放置油灰墊以覆蓋 GPU VR,並對油灰墊的整個表面區域以手指輕輕施壓,使其確實黏附。小心地移除剩餘的上襯。
    4. 將油灰墊對齊 GPU 上的標記;然後,將油灰墊放在 GPU 上,並對油灰墊的整個表面區域以手指輕輕施壓,使其確實黏附。小心地移除剩餘的上襯。
      小心
      • 油灰墊不得重複使用。每次拆除水迴路時,都必須將油灰墊更換為新的。
      圖 9. 更換 GPU 油灰墊
      GPU putty pads replacement
      1 GPU VR(用油灰墊覆蓋 GPU VR)
  5. 卸下維修托架和 GPU 水冷板組件。
    1. 首先,鬆開沒有導件插腳一側的緊固螺絲(PH1、1 x M3、0.5 牛頓米、4.3 英吋磅)。四個前方 GPU 的螺絲和插腳位置都不同。下圖以 GPU 8 為例進行說明。請務必在鬆開第一個螺絲之前檢查螺絲和插腳位置。
    2. 然後,鬆開有導件插腳一側的緊固螺絲(PH1、1 x M3、0.5 牛頓米、4.3 英吋磅)。
    3. 將維修托架和 GPU 水冷板組件從歧管上抬起以將其卸下。
      圖 10. 卸下維修托架和 GPU 水冷板組件
      Removing the service bracket and GPU cold plate assembly
      確保軟管不向內彎曲,以避免對接頭造成應力損壞。

  6. 將 GPU 水冷板放在 GPU 上。
    1. 翻轉維修托架和 GPU 水冷板組件,然後輕輕地將水冷板放在 GPU 上。
      確保軟管不向內彎曲,以避免對接頭造成應力損壞。
    2. 調整 GPU 水冷板,直到兩個導件插腳固定在 GPU 上的導孔中。
      圖 11. 放置 GPU 水冷板
      Placing the GPU cold plate
  7. 從 GPU 水冷板卸下維修托架。
    1. 鬆開將維修托架固定到 GPU 水冷板的兩個緊固螺絲。
    2. 將維修托架從 GPU 水冷板上抬起以將其卸下。
      圖 12. 卸下維修托架
      Removing the service bracket
  8. 依照螺絲安裝順序鎖緊螺絲 360 度:,然後重複上述步驟,使用設定為適當扭矩的螺絲起子完全鎖緊四個 Torx T15 螺絲。
    • (全新的水冷板模組除外)在鎖緊水冷板螺絲之前,請務必將 TIM 斷路器螺絲鬆開到其初始位置。

    • 鬆開 TIM 斷路器螺絲,使其恢復到初始位置。

    • 闔上蓋子。如果蓋子無法闔上,則需要進一步鬆開 TIM 斷路器螺絲。

    1. 首先將扭矩螺絲起子設定為 1.0±0.1 英吋磅、0.112±0.0112 牛頓米,以鎖上螺絲幾輪。然後將扭矩螺絲起子設定為 5.3±0.212 英吋磅、0.6±0.024 牛頓米以完全鎖緊螺絲。
      • 請務必遵循螺絲順序以防止水冷板傾斜。
    2. 重複上述步驟,直到四個 GPU 水冷板上的所有螺絲完全鎖緊。
    圖 13. GPU 水冷板螺絲擰緊順序
    GPU cold plate screw tightening sequence
  9. 將洩漏感應器模組纜線佈放回 GPU 水冷板,然後將其安裝在纜線夾中。
    圖 14. 安裝洩漏感應器模組纜線
    Installing the leakage sensor module cable
  10. (選用)以下步驟用於將後方 B200 GPU 水冷板模組歧管重新放置到其原始位置。
  11. 重新放置後方 B200 GPU 水冷板模組歧管。
    1. 將後方 B200 GPU 水冷板模組歧管與維修托架分離。
    2. 將歧管移回標有 B 的導件插腳,如圖所示。
    3. 確保歧管上的導槽與標有 B 的導件插腳牢固嚙合。
      圖 15. 重新放置後方 B200 GPU 水冷板模組歧管
      Repositioning the rear B200 GPU cold plate module manifold
  12. 鎖緊四個 M3 螺絲 (W7-W8)(PH2、2 x M3、0.5 牛頓米、4.3 英吋磅),將後方 B200 GPU 水冷板模組歧管固定到機箱。
    圖 16. 安裝後方 B200 GPU 水冷板模組歧管
    Installing the rear B200 GPU cold plate module manifold
  13. 從後方 B200 GPU 水冷板模組卸下維修托架。
    1. 完全鬆開將維修托架固定到 GPU 水冷板的兩個緊固螺絲;然後,將維修托架從 GPU 水冷板上抬起以將其卸下。重複上述步驟以卸下另一個。
      圖 17. 卸下後方維修托架
      Removing rear service bracket

在您完成之後

  1. 重新連接已拔掉的所有纜線。請參閱內部纜線佈線
  2. 重新安裝電源複合體。請參閱安裝電源複合體
  3. 重新安裝 CPU 複合體。請參閱安裝 CPU 複合體
  4. 重新安裝風扇機盒。請參閱安裝風扇機盒(僅限經過培訓的維修技術人員)
  5. 重新安裝後方上蓋。請參閱安裝後方上蓋
  6. 重新安裝前方上蓋。請參閱安裝前方上蓋
  7. 完成零件更換。請參閱完成零件更換