メインコンテンツまでスキップ

前面 B200 GPU コールド・プレート・モジュールの取り付け

前面 B200 GPU コールド・プレート・モジュールを取り付けるには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。

このタスクについて

重要
  • 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
  • コンポーネントが入っている帯電防止パッケージを、サーバーの塗装されていない金属面に接触させます。次に、それをパッケージから取り出し、帯電防止板の上に置きます。
  • トルク・ドライバーが手元にない場合はリクエストすることができます。
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
  • Torx T15 プラス・ドライバー
  • Torx T15 200mm 延長ビット
  • #1 プラス・ドライバー
  • #2 プラス・ドライバー
  • アルコール・クリーニング・パッド
  • B200 PCM
  • B200 SXM6 PAD-1
  • B200 SXM6 PAD-2
  • B200 GPU F&R 配送用ブラケット・キット
  • B200 GPU サービス・キット
B200 (GPU およびリタイマー NVSwitch) (サービスおよび配送用ブラケット) キットは再利用可能であり、GPU および GPU コールド・プレート・モジュールの保守時には必須です。将来の交換のニーズに備えて、サーバーが稼働する施設で保管することをお勧めします。
重要
パテ・パッド/相変化材料 (PCM) の交換ガイドライン
  • パテ・パッド/PCM を交換する前に、アルコール・クリーニング・パッドでハードウェアの表面を慎重にクリーニングします。
  • 変形しないように、パテ・パッド/PCM を慎重に持ちます。ねじ穴や開口部がパテ・パッド/PCM によってふさがれていないことを確認します。
  • 有効期限が切れたパテ・パッド/PCM は使用しないでください。パテ・パッド/PCM パッケージの有効期限を確認します。パテ・パッド/PCM の有効期限が切れている場合は、新しいパテ・パッド/PCM を取得して適切に交換します。
次の図は、B200 GPU 番号付けと XCC における対応するスロット番号を示しています。
図 1. B200 GPU 番号付け
B200 GPU numbering
物理 GPU ソケットXCC のスロット番号付けnvidia-smi の論理番号

GPU 1

スロット 21

4

GPU 2

スロット 24

7

GPU 3

スロット 22

5

GPU 4

スロット 23

6

GPU 5

スロット 17

0

GPU 6

スロット 20

3

GPU 7

スロット 18

1

GPU 8

スロット 19

2

次の図は、前面 B200 GPU コールド・プレート・モジュールのコンポーネントを示しています。
図 2. 前面 B200 GPU コールド・プレート・モジュールのコンポーネントの識別
Front B200 GPU cold plate module components identification
表 1. 前面 B200 GPU コールド・プレート・モジュールのコンポーネント
1 多岐管2 ホース・タイ
3 漏水センサー・モジュール4 配送用ブラケット
5 GPU コールド・プレート6 GPU スロット番号ラベル
7 GPU コールド・プレートのねじトルク・ラベル 

手順

  1. GPU 複合システムがシャーシに取り付けられていることを確認します。
  2. 前面 GPU コールド・プレート・モジュールの相変化材料 (PCM) を交換します。
    1. 配送用ブラケットが GPU コールド・プレート・モジュールに取り付けられていることを確認します。モジュールを裏返し、コールド・プレートが上を向くように面に置きます。
    2. PCM 治具を GPU コールド・プレートに取り付けます。
    3. パッドの片側からライナーを取り外します。PCM を治具に合わせ、コールド・プレートの上に置きます。治具を取り外し、PCM の表面領域全体に指の圧力を加えて、閉じ込められた空気を除去し、しっかり固定されるまで 1 ~ 2 分間の滞留時間を確保します。残っているトップ・ライナーをゆっくり取り外します。
    4. この手順を繰り返して、4 つのコールド・プレートの PCM を交換します。
      重要
      • PCM は再利用できません。PCM は、ウォーター・ループを取り外すたびに新しいのものに交換する必要があります。

      図 3. PCM アプリケーション
      PCM application
  3. GPU のパテ・パッド (x10) を交換します。
    1. B200 GPU の適用手順に従って、パテ・パッドを貼り付けます。
      • B200 SXM6 PAD-1 のパテ・パッドを番号 1 とマークされている 6 つの位置に貼り付けます。
      • B200 SXM6 PAD-1 のパテ・パッドを番号 2 とマークされている 2 つの位置に貼り付けます。
      • B200 SXM6 PAD-2 のパテ・パッドを、番号 3 と 4 (灰色) とマークされている GPU VR 上の 2 つの位置に貼り付けます。
      図 4. GPU パテ・パッドの説明
      GPU putty pads instructions
    2. パッドの片側からライナーを取り外します。
    3. 必ず 2 つの灰色のパテ・パッドを GPU VR (1) およびマーキングに合わせます。次に、図のようにパッドを GPU VR を覆うように置き、パッドの表面領域全体に軽く指の圧力を加えて接着します。残っているトップ・ライナーをゆっくり取り外します。
    4. パテ・パッドを GPU 上のマーキングに合わせます。次に、パッドを GPU の上に置き、パッドの表面領域全体に軽く指の圧力を加えて接着します。残っているトップ・ライナーをゆっくり取り外します。
    5. この手順を繰り返して、4 つの GPU のすべてのパテ・パッドを交換します。
      重要
      • パテ・パッドは再利用できません。パテ・パッドは、ウォーター・ループを取り外すたびに新しいものに交換する必要があります。
      図 5. GPU パテ・パッドの交換
      GPU putty pads replacement
      1 GPU VR (パテ・パッドで GPU VR を覆います)
  4. 前面 B200 GPU コールド・プレート・モジュールを取り付けます。
    1. 前面 B200 GPU コールド・プレート・モジュールを配送用ブラケットで持ちます。次に、多岐管のガイド・スロットをガイド・ピンに合わせ、コールド・プレート・モジュールを 4 つの前面 GPU に静かに配置します。
    2. 多岐管のガイド・スロットがシャーシのガイド・ピンにしっかりかみ合っていることを確認します。
      図 6. 前面 B200 GPU コールド・プレート・モジュールの取り付け
      Installing the front B200 GPU cold plate module
  5. 4 本の M3 ねじ (W5-W6) (PH2、4 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、前面 B200 GPU コールド・プレート・モジュール多岐管をシャーシに固定します。
    図 7. 前面 B200 GPU コールド・プレート・モジュール多岐管の取り付け
    Installing the front B200 GPU cold plate module manifold
  6. 配送用ブラケットを取り外します。
    1. 2 つの配送用ブラケットを前面 B200 GPU コールド・プレート・モジュールに固定している 20 本の拘束ねじを緩めます。
    2. シャーシから配送用ブラケットを持ち上げます。
      図 8. 配送用ブラケットの取り外し
      Removing the shipping brackets
  7. 2 つのガイド・ピンが GPU のガイド穴に収まるまで、コールド・プレートを調整します。これを繰り返して 4 つのコールド・プレートを調整します。
    図 9. GPU コールド・プレートの調整
    Adjusting the GPU cold plates
  8. ねじの取り付け順序 () に従って、ねじを 360 度締め、この手順を繰り返して、適切なトルクに設定されたドライバーで 16 本の Torx T15 ねじを完全に締め付けます。
    • (新品のコールド・プレート・モジュールを除く) コールド・プレートねじを締める前に、TIM ブレーカーねじが初期位置まで緩んでいることを確認します。

    • TIM ブレーカーねじを緩めて初期位置に戻します。

    • ふたを閉じます。ふたを閉められない場合は、TIM ブレーカーねじをさらに緩める必要があります。

    1. まず、トルク・ドライバーを 1.0±0.1 インチ・ポンド、0.112±0.0112 ニュートン・メーターに設定して、ねじを数ラウンド固定します。次に、トルク・ドライバーを 5.3±0.212 インチ・ポンド、0.6±0.024 ニュートン・メーターに設定して、ねじを完全に締めます。
      • コールド・プレートの傾きを防止するために、必ずねじの順序に従ってください。
    2. 4 つの GPU コールド・プレートのすべてのねじが完全に締まるまで繰り返します。
    図 10. GPU コールド・プレートのねじの締め付け順序
    GPU cold plate screw tightening sequence
  9. 背面 B200 GPU コールド・プレート・モジュールの位置を変更した場合は、手順 10 から 12 に進みます。背面 B200 GPU コールド・プレート・モジュールがまだ取り付けられていない場合は、手順 13 に進みます。
  10. 背面 B200 GPU コールド・プレート・モジュール多岐管の位置を変更します。
    1. 背面 B200 GPU コールド・プレート・モジュール多岐管をサービス・ブラケットから外します。
    2. 図のように、多岐管を B のマークが付いたガイド・ピンに戻します。
    3. 多岐管のガイド・スロットが、B のマークが付いたガイド・ピンにしっかりとかみ合っていることを確認します。
      図 11. 背面 B200 GPU コールド・プレート・モジュール多岐管の再配置
      Repositioning the rear B200 GPU cold plate module manifold
  11. 4 本の M3 ねじ (W7-W8) (PH2、2 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、背面 B200 GPU コールド・プレート・モジュール多岐管をシャーシに固定します。
    図 12. 背面 B200 GPU コールド・プレート・モジュール多岐管の取り付け
    Installing the rear B200 GPU cold plate module manifold
  12. サービス・ブラケットを背面 B200 GPU コールド・プレート・モジュールから外します。
    1. サービス・ブラケットを GPU コールド・プレートに固定している 2 本の拘束ねじを完全に緩めます。次に、サービス・ブラケットを GPU コールド・プレートから持ち上げて取り外します。これを繰り返してもう一方を取り外します。
      図 13. 背面サービス・ブラケットの取り外し
      Removing rear service bracket
  13. 次の図は、ホース・ホルダーの位置を示しています。
    図 14. ホース・ホルダーの位置
    Hose holder location
  14. ホース・ガイドとホース・ホルダーにホースを配置します。
    1. 前面 B200 GPU コールド・プレート・モジュールのホースおよびケーブルをホース・ガイドに配置し、ホース・タイで固定します。ファン制御ボードのケーブル配線および 漏水センサー・モジュールのケーブル配線を参照してください。
      ホース・ホルダーにケーブルを固定するときは、ホースの上にケーブルを配線しないように注意してください。
      重要
      • 取り付ける前に、ホースおよびホース・ホルダーのガイド・ラベルを確認してください。

      • 前面の GPU コールド・プレート・モジュール・ホースが背面の GPU コールド・プレート・モジュール・ホースの右側にあることを確認してください。



      • ホースで接合部を覆わないように注意してください。



      図 15. ホース・タイを使用したホースおよびケーブルの固定
      Securing the hoses and cables with hose ties
    2. 左側前面 B200 GPU コールド・プレート・モジュール・ホースを (1) ホース・ホルダー C に配置し、右側前面 B200 GPU コールド・プレート・モジュール・ホースを (2) ホース・ホルダー C に配置します。ホースのガイド・ラベルがホース・ホルダーのマーキングと一致していることを確認します。
      図 16. ホース・ホルダーへのホースの取り付け
      Placing the hoses on hose holders
      1 ホース・ホルダー C (左側)2 ホースホルダー C (右側)
  15. 新しい GPU 複合システムを取り付けた後に前面 B200 GPU コールド・プレート・モジュールを取り付ける場合は、背面ファン・ケージ・サポート・ブラケットを取り付ける前に、NVSwitch とリタイマー・コールド・プレート・モジュール、および背面 B200 GPU コールド・プレート・モジュールが取り付けられていることを確認してください。
  16. 背面ファン・ケージ・サポート・ブラケットを取り付けます。
    1. 背面ファン・ケージ・サポート・ブラケットを対応するねじ穴に合わせます。次に、図のように、背面ファン・ケージ・サポート・ブラケットをホース・ホルダー B/C の上に取り付けます。
    2. 4 本の M3 ねじ (PH2、4 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、背面ファン・ケージ・サポート・ブラケットをファン・ケージに固定します。
    3. 8 本の M3 ねじ (PH2、8 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、背面ファン・ケージ・サポート・ブラケットをシャーシに固定します。
      図 17. 背面ファン・ケージ・サポート・ブラケットの取り付け
      Installing the rear fan cage support bracket

完了したら

  1. 取り外してあったすべてのケーブルを再接続します。内部ケーブルの配線を参照してください。
  2. 電源複合システムを再度取り付けます。電源複合システムの取り付けを参照してください。
  3. CPU 複合システムを再度取り付けます。CPU 複合システムの取り付けを参照してください。
  4. ファン・ケージを再度取り付けます。ファン・ケージの取り付け (トレーニングを受けた技術員のみ)を参照してください。
  5. 背面トップ・カバーを再度取り付けます。背面トップ・カバーの取り付けを参照してください。
  6. 前面トップ・カバーを再度取り付けます。前面トップ・カバーの取り付けを参照してください。
  7. 部品交換を完了します。部品交換の完了を参照してください。