跳至主要内容

卸下後方 B200 GPU 水冷板模組

請依照本節中的指示卸下後方 B200 GPU 水冷板模組。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 關閉伺服器和週邊裝置的電源,並拔掉電源線和所有外部纜線。請參閱關閉伺服器電源
  • 如果伺服器安裝在機架中,請沿著其機架滑軌將伺服器滑出以接觸上蓋,或從機架卸下機箱。請參閱從機架卸下伺服器
  • 執行此程序時,現場需要兩個人和一台最大可承重 400 磅(181 公斤)的起重設備。如果您還沒有可用的起重設備,Lenovo 提供了 Genie Lift GL-8 material lift,可在 Data Center Solution Configurator。訂購 Genie Lift GL-8 material lift 時,請確保包含腳踏釋放煞車和負荷平台。
  • 如果您手邊沒有扭矩螺絲起子,可以要求提供。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T15 螺絲起子
  • Torx T15 200 公釐延長起子頭
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 酒精清潔布
  • B200 PCM
  • B200 SXM6 PAD-1
  • B200 SXM6 PAD-2
  • B200 GPU F&R 出貨托架套件
B200(GPU 和重定時器 NVSwitch)(維修和出貨托架)套件可重複使用,在維修 GPU 和 GPU 水冷板模組時是必要的工具。建議將它們保存在伺服器運作的設施中,以備將來更換需要。
重要
油灰墊/相變材料 (PCM) 更換準則
  • 在更換油灰墊/PCM 之前,請使用酒精清潔布輕輕清潔硬體表面。
  • 小心握住油灰墊/PCM,以免變形。確保沒有任何螺絲孔或開口被油灰墊/PCM 堵塞。
  • 請勿使用過期的油灰墊/PCM。檢查油灰墊/PCM 包裝上的到期日。如果油灰墊/PCM 已過期,請購買新品以正確更換。
下圖顯示了 B200 GPU 編號和 XCC 中對應的插槽編號。
圖 1. B200 GPU 編號
B200 GPU numbering
實體 GPU 插座XCC 中的插槽編號nvidia-smi 中的邏輯編號

GPU 1

插槽 21

4

GPU 2

插槽 24

7

GPU 3

插槽 22

5

GPU 4

插槽 23

6

GPU 5

插槽 17

0

GPU 6

插槽 20

3

GPU 7

插槽 18

1

GPU 8

插槽 19

2

下圖顯示後方 B200 GPU 水冷板模組的元件。
圖 2. 後方 B200 GPU 水冷板模組元件識別
Rear B200 GPU cold plate module components identification
表 1. 後方 B200 GPU 水冷板模組元件
1 歧管2 軟管束帶
3 洩漏感應器模組4 出貨托架
5 GPU 水冷板6 GPU 插槽號碼標籤
7 GPU 水冷板螺絲扭矩標籤 

程序

  1. 為此作業做好準備。
    1. 卸下前方上蓋。請參閱卸下前方上蓋
    2. 卸下後方上蓋。請參閱卸下後方上蓋
    3. 卸下風扇機盒。請參閱卸下風扇機盒(僅限經過培訓的維修技術人員)
    4. 卸下 CPU 複合體。請參閱卸下 CPU 複合體
    5. 卸下電源複合體。請參閱卸下電源複合體
    6. 如有必要,拔掉纜線並將其從 GPU 複合體卸下。在拔掉纜線之前,請使用清單記錄每條纜線和纜線所連接的接頭。請參閱內部纜線佈線
  2. 下圖顯示了水管固定器的位置。
    圖 3. 水管固定器位置
    Hose holder location
  3. 卸下後方風扇機盒支撐托架。
    1. 鬆開將後方風扇機盒支撐托架固定到機箱的八個 M3 螺絲。
    2. 鬆開將後方風扇機盒支撐托架固定到風扇機盒的四個 M3 螺絲。
    3. 抓住後方風扇機盒支撐托架,將其從風扇機盒中取出。
    圖 4. 卸下後方風扇機盒支撐托架
    Removing the hose cover
  4. 遵循水冷板標籤上指定的螺絲順序:,依次鬆開螺絲一圈,然後使用設定為適當扭矩的扭矩螺絲起子,完全鬆開十六個 Torx T15 螺絲。
    • 使用設定為適當扭矩的扭矩螺絲起子鬆開螺絲。將螺絲完全鬆開所需的扭矩為 5.3±0.212 英吋磅、0.6±0.024 牛頓米,供您參考。
    • 在卸下水冷板模組之前,請確保緊固螺絲完全鬆開。
    • 請務必遵循螺絲順序以防止水冷板傾斜。
    圖 5. 卸下 GPU 水冷板
    Removing the GPU cold plates
    • 如有需要,請使用 TIM 斷路器螺絲將水冷板與 GPU 分開。在鎖緊 TIM 斷路器螺絲之前,請務必先完全鬆開所有水冷板螺絲。

      • 打開 TIM 斷路器螺絲的蓋子。

      • 鎖緊 TIM 斷路器螺絲,將水冷板與 GPU 分開。

    • 使用後,將 TIM 斷路器螺絲恢復到其原始位置。

      • 鬆開 TIM 斷路器螺絲,使其恢復到初始位置。

      • 闔上蓋子。如果蓋子無法闔上,則需要進一步鬆開 TIM 斷路器螺絲。

  5. 鬆開將後方 B200 GPU 水冷板模組歧管固定到機箱的四個 M3 螺絲 (W7-W8)。
    圖 6. 卸下後方 B200 GPU 水冷板模組歧管
    Removing the rear B200 GPU cold plate module manifold
  6. 如圖所示,重新放置後方 B200 GPU 水冷板模組歧管。
    1. 將歧管與標有 B 的導件插腳分離,然後將歧管移動到標有 A 的導件插腳。
    2. 確保歧管上的導槽與標有 A 的導件插腳牢固嚙合。
      圖 7. 重新放置後方 B200 GPU 水冷板模組歧管
      Repositioning the rear B200 GPU cold plate module manifold
  7. 安裝出貨托架。
    1. 在安裝出貨托架之前,請卸下橫槓。鬆開四個緊固螺絲以卸下橫槓。
      圖 8. 卸下橫槓
      Removing crossbar
    2. 將出貨托架上的導件插腳與歧管和水冷板上的導孔對齊,然後將出貨托架向下放到前方 B200 GPU 水冷板模組上。
    3. 鎖緊十個緊固螺絲(PH1、10 x M3、0.5 牛頓米、4.3 英吋磅),將出貨托架固定到前方 B200 GPU 水冷板模組。重複上述步驟以安裝另一個出貨托架。
      圖 9. 安裝出貨托架

      安裝托架時,請避免夾住洩漏感應器模組纜線。

    4. 重新安裝橫槓。將橫槓對齊出貨托架;然後,鎖緊四個緊固螺絲,將橫槓安裝到出貨托架。
      圖 10. 安裝橫槓
      Installing the crossbar
  8. 使用歧管上的纜線夾固定洩漏感應器纜線。
    圖 11. 固定洩漏感應器纜線
    Securing the leakage sensor cable
  9. 卸下後方 B200 GPU 水冷板模組。
    1. 將軟管從將其固定到軟管導件的軟管束帶上鬆開。
    2. 使用出貨托架上的軟管束帶將軟管固定到出貨托架上。
    3. 握住出貨托架,提起後方 B200 GPU 水冷板模組,將其從機箱取出。
      圖 12. 卸下後方 B200 GPU 水冷板模組
      Removing the rear B200 GPU cold plate module
      小心
      • 建議在 PCM 處於液態時對其進行清潔。

      • GPU 上晶粒周圍的電氣元件極為精密。卸下 PCM 和清潔 GPU 晶粒時,請避免接觸電氣元件以免損壞。

  10. 立即使用酒精清潔布清除 GPU 上的 PCM 和油灰墊。輕輕清除 PCM 和油灰墊,以免 GPU 損壞。
    小心
    • 建議在 PCM 處於液態時對其進行清潔。

    • GPU 上晶粒周圍的電氣元件極為精密。卸下 PCM 和清潔 GPU 晶粒時,請避免接觸電氣元件以免損壞。

    圖 13. 清除 GPU 上的 PCM 和油灰墊
    Cleaning PCM and putty pads off from the GPUs
  11. 使用酒精清潔布擦掉 GPU 水冷板模組上殘留的油灰墊和 PCM。
    如果以後要重新安裝,請持續將出貨托架連接到水冷板模組。
    圖 14. 擦掉水冷板上的 PCM 和油灰墊
    Wiping PCM and putty pads off from the cold plates

在您完成之後

  1. 安裝替換裝置。請參閱安裝後方 B200 GPU 水冷板模組
  2. 如果指示您送回元件或選配裝置,請遵循所有包裝指示,並使用提供給您的任何包裝材料來運送。