跳至主要内容

卸下 B200 GPU 基板

請依照本節中的指示卸下 B200 GPU 基板。此程序必須由經過培訓的維修技術人員執行。

關於此作業

小心
  • 閱讀安裝準則安全檢驗核對清單,確保工作時安全無虞。
  • 關閉伺服器和週邊裝置的電源,並拔掉電源線和所有外部纜線。請參閱關閉伺服器電源
  • 如果伺服器是安裝在機架中,請從機架中卸下伺服器。請參閱從機架卸下伺服器
  • 執行此程序時,現場需要兩個人和一台最大可承重 400 磅(181 公斤)的起重設備。如果您還沒有可用的起重設備,Lenovo 提供了 Genie Lift GL-8 material lift,可在 Data Center Solution Configurator。訂購 Genie Lift GL-8 material lift 時,請確保包含腳踏釋放煞車和負荷平台。
確定您已備妥下列所需工具,以便正確更換元件:
  • Torx T15 螺絲起子
  • 2 x Torx T15 200 公釐延長起子頭
  • 1 號十字螺絲起子
  • 2 號十字螺絲起子
  • 酒精清潔布
  • 2 x B200 PCM
  • 2 x B200 SXM6 PAD-1
  • 2 x B200 SXM6 PAD-2
  • B200 GPU F&R 出貨托架套件
  • B200 GPU 維修套件
  • B200 重定時器 NVSwitch 維修套件
  • B200 重定時器 NVSwitch 出貨套件
  • B200 NVSwitch PCM
  • B200 NVSwitch PAD-1
  • B200 NVSwitch PAD-2
  • B200 GPU 基板把手
  • Torx T25 150 公釐延長起子頭(適用於 GPU 基板把手)
B200(GPU 和重定時器 NVSwitch)(維修和出貨托架)套件可重複使用,在維修 GPU 和 GPU 水冷板模組時是必要的工具。建議將它們保存在伺服器運作的設施中,以備將來更換需要。
確定您已備妥下列所需工具,以便正確更換元件:
  • 可設定為 0.6 牛頓米、5.3 英吋磅的扭矩螺絲起子
下圖顯示了 B200 GPU 編號和 XCC 中對應的插槽編號。
圖 1. B200 GPU 編號
B200 GPU numbering
實體 GPU 插座XCC 中的插槽編號nvidia-smi 中的邏輯編號

GPU 1

插槽 21

4

GPU 2

插槽 24

7

GPU 3

插槽 22

5

GPU 4

插槽 23

6

GPU 5

插槽 17

0

GPU 6

插槽 20

3

GPU 7

插槽 18

1

GPU 8

插槽 19

2

程序

  1. 為此作業做好準備。
    1. 卸下前方上蓋。請參閱卸下前方上蓋
    2. 卸下後方上蓋。請參閱卸下後方上蓋
    3. 卸下風扇機盒。請參閱卸下風扇機盒(僅限經過培訓的維修技術人員)
    4. 卸下 CPU 複合體。請參閱卸下 CPU 複合體
    5. 卸下電源複合體。請參閱卸下電源複合體
    6. GPU 基板拔掉纜線。
    7. 如有必要,拔掉並移除穿過 GPU 複合體的纜線。在拔掉纜線之前,請使用清單記錄每條纜線和纜線所連接的接頭。請參閱內部纜線佈線
    8. 卸下後方 B200 GPU 水冷板模組。請參閱卸下後方 B200 GPU 水冷板模組
    9. 卸下前方 B200 GPU 水冷板模組。請參閱卸下前方 B200 GPU 水冷板模組
    10. 卸下 NVSwitch 和重定時器水冷板模組。請參閱卸下 B200 NVSwitch 和重定時器水冷板模組
  2. 從機箱鬆開 PCIe 交換器滑動箱。
    1. 按下兩個藍色鬆開閂鎖。
    2. 轉動兩個鬆開拉桿,直到其與 PCIe 交換器滑動箱垂直。
    3. 向前拉動 PCIe 交換器滑動箱,直到其停止。
      重要
      拉出 PCIe 交換器滑動箱後,請將兩個鬆開拉桿向後推,直到其鎖入定位,以免損壞。
      圖 2. 將 PCIe 交換器滑動箱從停止位置卸下
      PCIe switch shuttle removal to stop position
  3. 鬆開兩個 M3 螺絲以卸下 GPU 接頭保護托架。
    圖 3. 卸下 GPU 接頭保護托架
    Removing the GPU connector protective bracket
  4. 鬆開兩個 M3 螺絲以卸下 CX-7 配接卡保護托架。
    圖 4. 卸下 CX-7 配接卡保護托架
    Removing CX-7 adapter card protective bracket
  5. 鬆開三個 M3 螺絲,從機箱卸下軟管導管。重複上述步驟,移除另一側的軟管導管。
    圖 5. 卸下軟管導管
    Removing hose guide
  6. 鬆開 GPU 基板上的十八個 Torx T15 緊固螺絲。
    使用設定為適當扭矩的扭矩螺絲起子鬆開或鎖緊螺絲。將螺絲完全鬆開或鎖緊所需的扭矩為 0.6±0.024 牛頓米、5.3±0.212 英吋磅,供您參考。
    圖 6. 卸下螺絲
    Screw removal
  7. 卸下 GPU 複合體。
    1. 安裝把手。將 Torx T25 延長起子頭連接到螺絲起子。將把手對齊螺絲孔,並將其向下放到 GPU 基板上;然後,鎖緊四個 M4 螺絲(4 x M4、0.5 牛頓米、4.3 英吋磅),將把手固定到 GPU 基板。
      圖 7. 安裝把手
      Installing the handles
    2. 握住兩個把手 (1),然後將 GPU 複合體從機箱中取出。
    小心
    確保 GPU 複合體兩側各站一人,握住兩個把手將其抬起。
    圖 8. 卸下 GPU 複合體
    Removing the GPU complex
    如果要運送 GPU 複合體進行 RMA 程序,請將把手固定在 GPU 基板上。
  8. 如有需要,請卸下把手。將 GPU 複合體小心放置在平坦的防靜電表面上;然後,將 Torx T25 延長起子頭連接到螺絲起子,並且鬆開將把手固定到基板的四個 M4 螺絲。提起把手,將其從基板卸下。
    如果要運送 GPU 複合體進行 RMA 程序,請將把手固定在 GPU 基板上。
    圖 9. 卸下把手
    Removing handles
  9. 從 GPU 基板卸下 GPU。使用設定為適當扭矩的螺絲起子,同時鬆開兩個對角 Torx T15 螺絲。
    1. 將 GPU 複合體小心放置在平坦的防靜電表面上。
    2. 將扭矩螺絲起子設定為 0.6 牛頓米、5.3 英吋磅,以同時鬆開兩個對角 螺絲;然後,同時鬆開兩個對角 螺絲。
      圖 10. 卸下 GPU
      Removing the GPU
    3. 沿對角線安裝兩個 GPU 螺絲把手。將螺絲把手對齊水冷板螺絲插槽;然後,用手鎖緊螺絲把手。
      圖 11. 安裝 GPU 螺絲把手
      Installing the GPU screw handles
    4. 握住 GPU 螺絲把手,從 GPU 基板卸下 GPU。
      圖 12. 卸下 GPU
      Removing the GPU
    5. 將 GPU 小心放置在平坦的防靜電表面上。用手鬆開兩個螺絲把手,將其卸下。
      圖 13. 卸下 GPU 螺絲把手
      Removing the GPU screw handles
    6. 重複上述步驟以卸下所有 GPU。

在您完成之後

  1. 安裝替換裝置。請參閱安裝 B200 GPU 基板
  2. 如果指示您送回元件或選配裝置,請遵循所有包裝指示,並使用提供給您的任何包裝材料來運送。