跳至主要内容

卸下前方 B200 GPU

請依照本節中的指示卸下前方 B200 GPU。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 關閉伺服器和週邊裝置的電源,並拔掉電源線和所有外部纜線。請參閱關閉伺服器電源
  • 如果伺服器安裝在機架中,請沿著其機架滑軌將伺服器滑出以接觸上蓋,或從機架卸下機箱。請參閱從機架卸下伺服器
  • 執行此程序時,現場需要兩個人和一台最大可承重 400 磅(181 公斤)的起重設備。如果您還沒有可用的起重設備,Lenovo 提供了 Genie Lift GL-8 material lift,可在 Data Center Solution Configurator。訂購 Genie Lift GL-8 material lift 時,請確保包含腳踏釋放煞車和負荷平台。
  • 如果您手邊沒有扭矩螺絲起子,可以要求提供。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T15 螺絲起子
  • 2 x Torx T15 200 公釐延長起子頭
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 酒精清潔布
  • B200 PCM
  • B200 SXM6 PAD-1
  • B200 SXM6 PAD-2
  • B200 GPU 維修套件
B200(GPU 和重定時器 NVSwitch)(維修和出貨托架)套件可重複使用,在維修 GPU 和 GPU 水冷板模組時是必要的工具。建議將它們保存在伺服器運作的設施中,以備將來更換需要。
重要
油灰墊/相變材料 (PCM) 更換準則
  • 在更換油灰墊/PCM 之前,請使用酒精清潔布輕輕清潔硬體表面。
  • 小心握住油灰墊/PCM,以免變形。確保沒有任何螺絲孔或開口被油灰墊/PCM 堵塞。
  • 請勿使用過期的油灰墊/PCM。檢查油灰墊/PCM 包裝上的到期日。如果油灰墊/PCM 已過期,請購買新品以正確更換。
下圖顯示了 B200 GPU 編號和 XCC 中對應的插槽編號。
圖 1. B200 GPU 編號
B200 GPU numbering
實體 GPU 插座XCC 中的插槽編號nvidia-smi 中的邏輯編號

GPU 1

插槽 21

4

GPU 2

插槽 24

7

GPU 3

插槽 22

5

GPU 4

插槽 23

6

GPU 5

插槽 17

0

GPU 6

插槽 20

3

GPU 7

插槽 18

1

GPU 8

插槽 19

2

程序

  1. 為此作業做好準備。
    1. 卸下前方上蓋。請參閱卸下前方上蓋
    2. 卸下後方上蓋。請參閱卸下後方上蓋
    3. 卸下風扇機盒。請參閱卸下風扇機盒(僅限經過培訓的維修技術人員)
    4. 卸下 CPU 複合體。請參閱卸下 CPU 複合體
    5. 卸下電源複合體。請參閱卸下電源複合體
    6. 如有必要,拔掉纜線並將其從 GPU 複合體卸下。在拔掉纜線之前,請使用清單記錄每條纜線和纜線所連接的接頭。請參閱內部纜線佈線
  2. 如果安裝了後方 B200 GPU 水冷板模組,請重新放置後方 B200 GPU 水冷板歧管以騰出空間。
  3. 重新放置後方 B200 GPU 水冷板歧管,為前方 B200 GPU 建立空間。將兩個維修托架安裝到後方 GPU 水冷板上。
    1. 將維修托架上的導件插腳對齊 GPU 水冷板上的導孔,然後將其向下放到水冷板上。
    2. 鎖緊兩個緊固螺絲(PH1、2 x M3、0.5 牛頓米、4.3 英吋磅),將維修托架安裝到後方 GPU 水冷板上。重複上述步驟,安裝另一個維修托架。
      圖 2. 將維修托架安裝到後方 GPU 水冷板
      Installing the shipping brackets to the rear GPU cold plates
      安裝托架時,請避免夾住洩漏感應器模組纜線。

  4. 鬆開將後方 B200 GPU 水冷板模組歧管固定到機箱的四個 M3 螺絲 (W7-W8)。
    圖 3. 卸下後方 B200 GPU 水冷板模組歧管
    Removing the rear B200 GPU cold plate module manifold
  5. 重新放置後方 B200 GPU 水冷板模組歧管。
    1. 如圖所示,翻轉後方 B200 GPU 水冷板模組歧管。將歧管上的導件插腳對齊並插入出貨托架上的導槽,然後將歧管嚙合到維修托架。
    2. 確保歧管上的導件插腳與出貨托架上的導槽牢固嚙合。
      圖 4. 重新放置後方 GPU 水冷板模組歧管
      Repositioning the rear B200 GPU cold plate module manifold
  6. 找出前方 GPU。
  7. 從纜線夾卸下洩漏感應器模組纜線,使其脫離該水冷板並佈放到相鄰的水冷板上。
    圖 5. 卸下洩漏感應器模組纜線
    Removing the leakage sensor module cable
  8. 遵循水冷板標籤上指定的螺絲順序:,依次鬆開螺絲一圈,然後使用設定為適當扭矩的扭矩螺絲起子,完全鬆開四個 Torx T15 螺絲。
    • 使用設定為適當扭矩的扭矩螺絲起子鬆開螺絲。將螺絲完全鬆開所需的扭矩為 5.3±0.212 英吋磅、0.6±0.024 牛頓米,供您參考。
    • 在卸下水冷板模組之前,請確保緊固螺絲完全鬆開。
    • 請務必遵循螺絲順序以防止水冷板傾斜。
    圖 6. 卸下 GPU 水冷板
    Removing the GPU cold plate
    • 如有需要,請使用 TIM 斷路器螺絲將水冷板與 GPU 分開。在鎖緊 TIM 斷路器螺絲之前,請務必先完全鬆開所有水冷板螺絲。

      • 打開 TIM 斷路器螺絲的蓋子。

      • 鎖緊 TIM 斷路器螺絲,將水冷板與 GPU 分開。

    • 使用後,將 TIM 斷路器螺絲恢復到其原始位置。

      • 鬆開 TIM 斷路器螺絲,使其恢復到初始位置。

      • 闔上蓋子。如果蓋子無法闔上,則需要進一步鬆開 TIM 斷路器螺絲。

  9. 將維修托架安裝到前方 GPU 水冷板上。確保維修托架按圖中所示方向安裝,翼面朝向歧管。
    1. 將維修托架底部的兩個緊固螺絲和導件插腳對齊 GPU 水冷板上的螺絲孔和導孔,然後將其向下放到水冷板上。
    2. 鎖緊兩個緊固螺絲(PH1、2 x M3、0.5 牛頓米、4.3 英吋磅),將維修托架固定到 GPU 水冷板。
      圖 7. 將維修托架安裝到 GPU 水冷板上
      Installing the service bracket onto the GPU cold plate
      安裝托架時,請避免夾住洩漏感應器模組纜線。

  10. 將維修托架和 GPU 水冷板組件安裝到前方 B200 GPU 水冷板模組歧管上。
    1. 翻轉維修托架和 GPU 水冷板組件,然後將兩個緊固螺絲和兩個導件插腳對齊歧管上的螺絲孔和導孔。
      確保軟管不向內彎曲,以避免對接頭造成應力損壞。

    2. 首先,鎖緊沒有導件插腳一側的緊固螺絲(PH1、1 x M3、0.5 牛頓米、4.3 英吋磅)。四個前方 GPU 的螺絲和插腳位置都不同。下圖以 GPU 8 為例進行說明。請務必在鎖緊第一個螺絲之前檢查螺絲和插腳位置。
    3. 然後,鎖緊有導件插腳一側的緊固螺絲(PH1、1 x M3、0.5 牛頓米、4.3 英吋磅)。
      圖 8. 安裝維修托架和 GPU 水冷板組件
      Installing the service bracket and the GPU cold plate assembly
      確保將維修托架和 GPU 水冷板組件安裝在與特定 GPU 插槽號碼對應的螺絲孔和導孔中。
      圖 9. 維修托架和 GPU 水冷板組件安裝位置
      Service bracket and GPU cold plate assembly installation location
      表 1. GPU 水冷板和維修托架組件安裝位置
      安裝位置GPU 插槽號碼
      1GPU 1
      2GPU 5
      3GPU 4
      4GPU 8
  11. 立即使用酒精清潔布清除 GPU 上的 PCM 和油灰墊。輕輕清除 PCM 和油灰墊,以免 GPU 損壞。
    小心
    • 建議在 PCM 處於液態時對其進行清潔。

    • GPU 上晶粒周圍的電氣元件極為精密。卸下 PCM 和清潔 GPU 晶粒時,請避免接觸電氣元件以免損壞。

    圖 10. 清除 GPU 上的 PCM 和油灰墊
    Cleaning PCM and putty pads off from the GPU
  12. 使用酒精清潔布擦掉 GPU 水冷板上殘留的油灰墊和 PCM。
    圖 11. 擦掉水冷板上的 PCM 和油灰墊
    Wiping PCM and putty pads off from the cold plate
  13. 卸下 GPU。將兩個 Torx T15 200 公釐延長起子頭連接到兩個扭矩螺絲起子。使用設定為適當扭矩的螺絲起子,同時鬆開兩個對角 Torx T15 螺絲。
    1. 將扭矩螺絲起子設定為 0.6 牛頓米、5.3 英吋磅,以同時鬆開兩個對角 螺絲;然後,同時鬆開兩個對角 螺絲。
      圖 12. 卸下 GPU
      Removing the GPU
    2. 沿對角線安裝兩個 GPU 螺絲把手。將螺絲把手對齊水冷板螺絲插槽;然後,用手鎖緊螺絲把手。
      圖 13. 安裝 GPU 螺絲把手
      Installing the GPU screw handles
    3. 握住 GPU 螺絲把手,從 GPU 基板卸下 GPU。
      圖 14. 卸下 GPU
      Removing the GPU
    4. 將 GPU 小心放置在平坦的防靜電表面上。用手鬆開兩個螺絲把手,將其卸下。
      圖 15. 卸下 GPU 螺絲把手
      Removing the GPU screw handles

在您完成之後

  1. 安裝替換裝置。請參閱安裝前方 B200 GPU
  2. 如果指示您送回元件或選配裝置,請遵循所有包裝指示,並使用提供給您的任何包裝材料來運送。