跳至主要内容

卸下 H100/H200 GPU 和散熱槽模組

請依照本節中的指示卸下 H100/H200 GPU 和散熱槽模組。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 關閉伺服器和週邊裝置的電源,並拔掉電源線和所有外部纜線。請參閱關閉伺服器電源
  • 執行此程序時,現場需要兩個人和一台最大可承重 400 磅(181 公斤)的起重設備。如果您還沒有可用的起重設備,Lenovo 提供了 Genie Lift GL-8 material lift,可在 Data Center Solution Configurator。訂購 Genie Lift GL-8 material lift 時,請確保包含腳踏釋放煞車和負荷平台。
  • 確保檢查 GPU 和 GPU 基板上的接頭和插座。如果 GPU 或 GPU 基板上的接頭損壞或遺失,或插座中有碎屑,請勿使用。更換新的 GPU 或 GPU 基板,然後再繼續安裝程序。
  • GPU 和散熱槽是一個零件。請勿從 GPU 卸下散熱槽。
  • 下表顯示關於實體 GPU 插座、XCC 中的插槽編號,以及 nvidia-smi 中的模組 ID 對應資訊。


    實體 GPU 插座XCC 中的插槽編號nvidia-smi 中的模組 ID
    SXM 1插槽 211
    SXM 2插槽 242
    SXM 3插槽 223
    SXM 4插槽 234
    SXM 5插槽 175
    SXM 6插槽 206
    SXM 7插槽 187
    SXM 8插槽 198
確定您已備妥下列所需工具,以便正確更換元件:
  • 可設定為 0.6 牛頓米、5.3 英吋磅的扭矩螺絲起子
  • Torx T15 加長起子頭 (長度 200 公釐)
  • H100/H200 夾具

程序

  1. 為此作業做好準備。
    1. 卸下所有電源供應器。請參閱卸下熱抽換電源供應器
    2. 卸下所有前方風扇。請參閱卸下熱抽換風扇(前方和後方)
    3. 從機槽卸下所有 2.5 吋熱抽換硬碟和機槽填充板(如果有的話)。請參閱卸下 2.5 吋熱抽換硬碟
    4. 8U GPU 滑動箱從機箱中拉出,並將其放置到升降平台上。請參閱卸下 8U GPU 滑動箱
    5. 卸下電源複合體。請參閱卸下電源複合體
    6. (僅限 GPU 和散熱槽模組 2、4、5 和 7)卸下 GPU 空氣導管。請參閱卸下 H100/H200 GPU 空氣導管
  2. GPU 和散熱槽模組卸下塑膠蓋。
    圖 1. 卸下塑膠蓋
    Plastic cover removal
  3. 將夾具與 GPU 散熱槽對齊,並小心地安裝到 GPU 散熱槽上。
    圖 2. 安裝夾具
    Jig installation
  4. 將扭矩螺絲起子插入夾具上的指定孔位,並依下圖所示順序鬆開四顆 Torx T15 螺絲 ( > > > )。
    使用設定為適當扭矩的扭矩螺絲起子來鬆開螺絲。將螺絲完全鬆開所需的扭矩為 0.6 牛頓米、5.3 英吋磅,供您參考。
    圖 3. 卸下螺絲
    Screw removal
  5. 從 GPU 散熱槽取下夾具。
    圖 4. 取下夾具
    Jig removal
  6. 請雙手提起 GPU 與散熱槽模組,將其從 GPU 基板上取出。
    圖 5. 卸下 GPU 與散熱槽模組
    GPU and heat sink module removal

在您完成之後

如果指示您送回元件或選配裝置,請遵循所有包裝指示,並使用提供給您的任何包裝材料來運送。