卸下 H100/H200 GPU 和散熱槽模組
請依照本節中的指示卸下 H100/H200 GPU 和散熱槽模組。此程序必須由經過培訓的維修技術人員執行。
關於此作業
小心
- 閱讀安裝準則和安全檢驗核對清單,確保工作時安全無虞。
- 關閉伺服器和週邊裝置的電源,並拔掉電源線和所有外部纜線。請參閱關閉伺服器電源。
- 執行此程序時,現場需要兩個人和一台最大可承重 400 磅(181 公斤)的起重設備。如果您還沒有可用的起重設備,Lenovo 提供了 Genie Lift GL-8 material lift,可在 Data Center Solution Configurator。訂購 Genie Lift GL-8 material lift 時,請確保包含腳踏釋放煞車和負荷平台。
- 確保檢查 GPU 和 GPU 基板上的接頭和插座。如果 GPU 或 GPU 基板上的接頭損壞或遺失,或插座中有碎屑,請勿使用。更換新的 GPU 或 GPU 基板,然後再繼續安裝程序。
- GPU 和散熱槽是一個零件。請勿從 GPU 卸下散熱槽。
- 下表顯示關於實體 GPU 插座、XCC 中的插槽編號,以及 nvidia-smi 中的模組 ID 對應資訊。
實體 GPU 插座 XCC 中的插槽編號 nvidia-smi 中的模組 ID SXM 1 插槽 21 1 SXM 2 插槽 24 2 SXM 3 插槽 22 3 SXM 4 插槽 23 4 SXM 5 插槽 17 5 SXM 6 插槽 20 6 SXM 7 插槽 18 7 SXM 8 插槽 19 8
註
確定您已備妥下列所需工具,以便正確更換元件:
- 可設定為 0.6 牛頓米、5.3 英吋磅的扭矩螺絲起子
- Torx T15 加長起子頭 (長度 200 公釐)
- H100/H200 夾具
程序
在您完成之後
如果指示您送回元件或選配裝置,請遵循所有包裝指示,並使用提供給您的任何包裝材料來運送。
提供意見回饋