跳至主要内容

移除前方 H100/H200 GPU

請依照本節中的指示移除前方 H100/H200 GPU。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 關閉伺服器和週邊裝置的電源,並拔掉電源線和所有外部纜線。請參閱關閉伺服器電源
  • 如果伺服器安裝在機架中,請沿著其機架滑軌將伺服器滑出以接觸上蓋,或從機架卸下機箱。請參閱從機架卸下伺服器
  • 執行此程序時,現場需要兩個人和一台最大可承重 400 磅(181 公斤)的起重設備。如果您還沒有可用的起重設備,Lenovo 提供了 Genie Lift GL-8 material lift,可在 Data Center Solution Configurator。訂購 Genie Lift GL-8 material lift 時,請確保包含腳踏釋放煞車和負荷平台。
  • 如果您手邊沒有扭矩螺絲起子,可以要求提供。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T10 螺絲起子
  • Torx T15 螺絲起子
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 平頭螺絲起子
  • 酒精清潔布
  • H100/H200 PCM 套件
  • SR780a V3 水迴路油灰墊套件
  • SR780a V3 水迴路維護套件
重要
油灰墊/相變材料 (PCM) 更換準則
  • 在更換油灰墊/PCM 之前,請使用酒精清潔布輕輕清潔硬體表面。
  • 小心握住油灰墊/PCM,以免變形。確保沒有任何螺絲孔或開口被油灰墊/PCM 堵塞。
  • 請勿使用過期的油灰墊/PCM。檢查油灰墊/PCM 包裝上的到期日。如果油灰墊/PCM 已過期,請購買新品以正確更換。
下圖顯示了 GPU 編號和 XCC 中對應的插槽編號。
圖 1. GPU 編號
GPU numbering

程序

  1. 為此作業做好準備。
    1. 卸下前方上蓋。請參閱卸下前方上蓋
    2. 卸下後方上蓋。請參閱卸下後方上蓋
    3. 卸下風扇機盒。請參閱卸下風扇機盒(僅限經過培訓的維修技術人員)
    4. 卸下 CPU 複合體。請參閱卸下 CPU 複合體
    5. 卸下電源複合體。請參閱卸下電源複合體
    6. 如有必要,拔掉纜線並將其從 GPU 複合體卸下。在拔掉纜線之前,請使用清單記錄每條纜線和纜線所連接的接頭。請參閱內部纜線佈線
  2. 重新放置後方 H100/H200 GPU 水冷板模組,為前方 H100/H200 GPU 水冷板模組建立空間。
  3. 將出貨托架安裝到後方 GPU 水冷板上。
    1. 將出貨托架上的導件插腳對齊 GPU 水冷板上的導孔,並將其向下放到水冷板上;然後鎖緊四個緊固螺絲(PH1、4 x M3、0.5 牛頓米、4.3 英吋磅),將出貨托架安裝到後方 GPU 水冷板上。
      圖 2. 將出貨托架安裝到後方 GPU 水冷板
      Installing the shipping brackets to the rear GPU cold plates
    2. 鬆開兩個緊固螺絲,然後從出貨托架卸下把手。
      圖 3. 從出貨托架卸下把手
      Removing the handles from shipping brackets
  4. 鬆開將後方 H100/H200 GPU 水冷板模組歧管固定到機箱的四個 M3 螺絲 (W7-W8)。
    圖 4. 卸下後方 H100/H200 GPU 水冷板模組歧管
    Removing the rear H100/H200 GPU cold plate module manifold
  5. 重新放置後方 H100/H200 GPU 水冷板模組歧管。
    1. 如圖所示,翻轉後方 H100/H200 GPU 水冷板模組歧管。將歧管上的導件插腳與出貨托架上的導槽對齊,然後將歧管安裝到出貨托架上,如圖所示。
    2. 確保歧管上的導件插腳與出貨托架上的導槽牢固嚙合。
      圖 5. 重新放置後方 GPU 水冷板模組歧管
      Repositioning the rear H100/H200 GPU cold plate module manifold
  6. 找出前方 GPU。
  7. 從纜線夾移除洩漏感應器模組纜線,將其從水冷板布佈放,然後重新安裝在與水冷板相鄰的纜線夾中。
    圖 6. 移除洩漏感應器模組纜線
    Removing the leakage sensor module cables
  8. 遵循水冷板標籤上指定的螺絲順序 ,使用設定為適當扭矩的扭矩螺絲起子完全鬆開四個 Torx T10 螺絲。
    • 使用設定為適當扭矩的扭矩螺絲起子鬆開或鎖緊螺絲。將螺絲完全鬆開或鎖緊所需的扭矩為 0.4±0.05 牛頓米、3.5±0.5 磅吋,供您參考。
    • 在卸下水冷板模組之前,請確保緊固螺絲完全鬆開。
    圖 7. 卸下 GPU 水冷板
    Removing the GPU cold plate
    如有需要,請使用平頭螺絲起子將水冷板和 GPU 從水冷板的角落輕輕分開。確保不會損壞 GPU 或水冷板。
  9. 將維修托架安裝到 GPU 水冷板上。
    1. 將維修托架底部的兩個緊固螺絲和導件插腳對齊 GPU 水冷板上的螺絲孔和導孔,然後將其向下放到水冷板上。
    2. 鎖緊兩個緊固螺絲(PH1、2 x M3、0.5 牛頓米、4.3 英吋磅),將維修托架固定到 GPU 水冷板。
      圖 8. 將維修托架安裝到 GPU 水冷板上
      Installing the service bracket onto the GPU cold plate
  10. 將維修托架和 GPU 水冷板組件安裝到前方 H100/H200 GPU 水冷板模組歧管上。
    1. 翻轉維修托架和 GPU 水冷板組件,然後將兩個緊固螺絲和兩個導件插腳對齊歧管上的螺絲孔和導孔。
    2. 鎖緊兩個緊固螺絲(PH1、2 x M3、0.5 牛頓米、4.3 英吋磅),將維修托架和 GPU 水冷板組件固定到歧管。
      圖 9. 安裝維修托架和 GPU 水冷板組件
      Installing the service bracket and the GPU cold plate assembly
      確保將維修托架和 GPU 水冷板組件安裝在與特定 GPU 插槽號碼對應的螺絲孔和導孔中。
      圖 10. 維修托架和 GPU 水冷板組件安裝位置
      Service bracket and GPU cold plate assembly installation location
      表 1. GPU 水冷板和維修托架組件安裝位置
      安裝位置GPU 插槽號碼
      12GPU 4
      23GPU 1
      34GPU 8
      45GPU 5
  11. 立即使用酒精清潔布清除 GPU 上的 PCM 和油灰墊。輕輕清除 PCM 和油灰墊,以免 GPU 損壞。
    小心
    • 建議在 PCM 處於液態時對其進行清潔。

    • GPU 上晶粒周圍的電氣元件極為精密。卸下 PCM 和清潔 GPU 晶粒時,請避免接觸電氣元件以免損壞。

    圖 11. 清除 GPU 上的 PCM 和油灰墊
    Cleaning PCM and putty pads off from the GPU
  12. 使用酒精清潔布擦掉 GPU 水冷板上殘留的油灰墊和 PCM。
    圖 12. 擦掉水冷板上的 PCM 和油灰墊
    Wiping PCM and putty pads off from the cold plate
  13. 卸下 GPU。
    1. 依照下圖所示的順序鬆開四個 Torx T15 螺絲。
      使用設定為適當扭矩的扭矩螺絲起子鬆開螺絲。將螺絲完全鬆開所需的扭矩為 0.6 牛頓米、5.3 英吋磅,供您參考。
    2. 從 GPU 基板移除 GPU。
      圖 13. 卸下 GPU
      Removing the GPU

在您完成之後

  1. 安裝替換裝置。請參閱安裝前方 H100/H200 GPU
  2. 如果指示您送回元件或選配裝置,請遵循所有包裝指示,並使用提供給您的任何包裝材料來運送。