メインコンテンツまでスキップ

背面 H100/H200 GPU コールド・プレート・モジュールの取り付け

背面 H100/H200 GPU コールド・プレート・モジュールを取り付けるには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。

このタスクについて

重要
  • 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
  • コンポーネントが入っている帯電防止パッケージを、サーバーの塗装されていない金属面に接触させます。次に、それをパッケージから取り出し、帯電防止板の上に置きます。
  • トルク・ドライバーが手元にない場合はリクエストすることができます。
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
  • Torx T10 プラス・ドライバー
  • Torx T15 プラス・ドライバー
  • #1 プラス・ドライバー
  • #2 プラス・ドライバー
  • マイナス・ドライバー
  • アルコール・クリーニング・パッド
  • H100/H200 PCM キット
  • SR780a V3ウォーター・ループ・パテ・パッド・キット
  • SR780a V3ウォーター・ループ・サービス・キット
  • H100/H200 GPU 保守固定具キット
重要
パテ・パッド/相変化材料 (PCM) の交換ガイドライン
  • パテ・パッド/PCM を交換する前に、アルコール・クリーニング・パッドでハードウェアの表面を慎重にクリーニングします。
  • 変形しないように、パテ・パッド/PCM を慎重に持ちます。ねじ穴や開口部がパテ・パッド/PCM によってふさがれていないことを確認します。
  • 有効期限が切れたパテ・パッド/PCM は使用しないでください。パテ・パッド/PCM パッケージの有効期限を確認します。パテ・パッド/PCM の有効期限が切れている場合は、新しいパテ・パッド/PCM を取得して適切に交換します。
次の図は、GPU の番号と XCC における対応するスロット番号を示しています。
図 1. GPU 番号付け
GPU numbering
次の図は、背面 H100/H200 GPU コールド・プレート・モジュールのコンポーネントを示しています。
図 2. 背面 H100/H200 GPU コールド・プレート・モジュールのコンポーネントの識別
Rear H100/H200 GPU cold plate module components identification
表 1. 背面 H100/H200 GPU コールド・プレート・モジュールのコンポーネント
1 多岐管2 ホース・タイ
3 漏水センサー・モジュール4 配送用ブラケット
5 GPU コールド・プレート6 GPU スロット番号ラベル
7 GPU コールド・プレートのねじトルク・ラベル 

手順

  1. GPU 複合システムがシャーシに取り付けられていることを確認します。
  2. 背面 H100/H200 GPU コールド・プレート・モジュールの相変化材料を交換します。
    1. パッドの片側からライナーを取り外します。
    2. PCM をコールド・プレートの下部にあるマーキングと合わせ、コールド・プレートの上に置きます。次に、PCM の表面領域全体に指で圧力を加えて、閉じ込められた空気を除去し、しっかり固定されるまで 1 ~ 2 分間の滞留時間を確保します。残っているトップ・ライナーをゆっくり取り外します。
    3. この手順を繰り返して、4 つのコールド・プレートの PCM を交換します。
      重要
      • PCM は再利用できません。PCM は、ウォーター・ループを取り外すたびに新しいのものに交換する必要があります。

      • PCM を交換した後、GPU が通常の動作に戻るまでに短時間のスロットルが予想されます。これは、PCM が交換後に慣らし期間を必要とするためです。

      • GPU PCM とパテ・パッドを交換した後、保守担当者は H100/H200 GPU PCM TIM 溶融手順を実行して、PCM 熱伝導インターフェース材 (TIM) が溶けるまで GPU を監視する必要があります。
      図 3. PCM アプリケーション
      PCM application
  3. GPU のパテ・パッド (5 個) を交換します。
    1. パッドの片側からライナーを取り外します。
    2. パテ・パッドを GPU VR (1) および GPU 上のマーキングに合わせます。次に、パッドを GPU の上に置き、パッドの表面領域全体に指で軽く圧力を加えます。残っているトップ・ライナーをゆっくり取り外します。
    3. この手順を繰り返して、4 つの GPU のすべてのパテ・パッドを交換します。
      重要
      • パテ・パッドは再利用できません。パテ・パッドは、ウォーター・ループを取り外すたびに新しいものに交換する必要があります。
      • GPU PCM とパテ・パッドを交換した後、保守担当者は H100/H200 GPU PCM TIM 溶融手順を実行して、PCM 熱伝導インターフェース材 (TIM) が溶けるまで GPU を監視する必要があります。
      図 4. GPU パテ・パッドの交換
      GPU putty pads replacement
      1 GPU VR (パテ・パッドで GPU VR を覆います)
  4. 背面 H100/H200 GPU コールド・プレート・モジュールを取り付けます。
    1. 背面 H100/H200 GPU コールド・プレート・モジュールを配送用ブラケットで持ちます。次に、多岐管のガイド・スロットを A のマークが付いたガイド・ピンの位置に合わせ、コールド・プレート・モジュールを 4 つの背面 GPU に静かに配置します。
    2. 多岐管のガイド・スロットが、シャーシ上の A のマークが付いたガイド・ピンにしっかりとかみ合っていることを確認します。
      図 5. 背面 H100/H200 GPU コールド・プレート・モジュールの取り付け
      Installing the rear H100/H200 GPU cold plate module
  5. 配送用ブラケットを背面 H100/H200 GPU コールド・プレート・モジュールに固定している 6 本の拘束ねじを緩めます。次に、背面 H100/H200 GPU コールド・プレート・モジュールから配送用ブラケットを取り外します。
    図 6. 配送用ブラケットの取り外し
    Removing the shipping brackets
  6. 2 つのガイド・ピンが GPU のガイド穴に収まるまで、コールド・プレートを調整します。これを繰り返して 4 つのコールド・プレートを調整します。
    図 7. GPU コールド・プレートの調整
    Adjusting the GPU cold plates
  7. H100/H200 GPU 保守固定具キットを使用してコールド・プレートを取り付けます。次の図は、H100/H200 GPU 保守固定具のコンポーネントを示しています。
    図 8. H100/H200 GPU 保守固定具コンポーネントの識別
    H100/H200 GPU service fixture components identification
    表 2. H100/H200 GPU 保守固定具
    1 H100/H200 GPU 保守固定具2 ハンドル
    3 クランプ・ヘッド4 スペーサー
    5 背面 GPU コールド・プレート用台座6 前面 GPU コールド・プレート用台座
  8. H100/H200 GPU 保守固定具を背面 GPU コールド・プレートに取り付けます。固定具の「Rear」とマークされたガイド・スロットをシャーシのガイド・ピンに合わせ、固定具をシャーシに慎重に取り付けます。6 本の M3 ねじ (C3/P2/P3) (PH2、6 x M3、0.7 ニュートン・メーター、6 インチ・ポンド) を締めて、固定具をシャーシに固定します。
    図 9. 背面 GPU コールド・プレートへの固定具の取り付け

    Installing fixture to the rear GPU cold plates
  9. 台座をコールド・プレートの 4 本のねじに合わせて、図のように「FRONT」のサインがシャーシの前面を向くようにして、コールド・プレートに台座を慎重に置きます。台座を配置する前に、すべてのセンサー・ケーブルとホースを邪魔にならないところに移動していることを確認します。
    重要
    • センサー・ケーブルまたはホースが台座とコールド・プレートの間にはさまれていないことを確認します。

    • 「FRONT」のサインがシャーシの前面を向いていることを確認します。

    図 10. テーブルの配置
    Placing the table
  10. クランプ・ヘッドを調整します。
    1. レバー上部の六角ナットを緩めます。
    2. レバー下部の六角ナットを緩めます。
      図 11. クランプ・ヘッドのねじを緩める
      Loosening the screws on the clamp head
    3. ハンドルを少しまっすぐな位置まで前方に押します。図のようにクランプ・ヘッドが台座の中央に収まるように調整します。
    4. レバー下部の六角ナットを締めます。
    5. 六角ナット・ソケット・ビットをドライバーに取り付けます。クランプ・ヘッドを片手で所定の位置に保持します。次に、ドライバーを使用してレバー上部の六角ナットを締めます。
      図 12. クランプ・ヘッドの調整
      Adjusting the clamp head
  11. スペーサーをクランプ・ヘッドに置き、スペーサーを持ちながらハンドルを完全にまっすぐな位置に引きます。
    図 13. ハンドルを引く
    Pulling the handle
  12. T10 拡張ビットをトルク・ドライバーに取り付けます。固定具とコールド・プレートのラベルに示されているねじの順序に従い、ドライバーを適切なトルクに設定して16 本の Torx T10 ねじを繰り返し完全に締め付けます。
    1. トルク・ドライバーを 0.4±0.05 ニュートン・メーター、3.5±0.5 ポンド・インチに設定します。
    2. ねじの取り付け順序に従って、ねじを 720 度締めます:
      GPU コールド・プレートの傾きを防止するために、必ずねじの取り付け順序に従います。
    3. GPU コールド・プレートのすべてのねじが完全に締まるまで繰り返します。
    図 14. 繰り返して、すべてのねじを完全に締める
    Repeat to fully tighten all the screws
    図 15. GPU コールド・プレートのねじの締め付け順序
    GPU cold plate screw tightening sequence
    図 16. GPU コールド・プレートの取り付け
    Installing the GPU cold plates
  13. 固定具でねじを固定した後、台座を取り外してねじを締め直します。ねじの取り付け順序 に従い、0.4±0.05 ニュートン・メーター、3.5±0.5 ポンド・インチに設定された Torx T10 ドライバーでコールド・プレートのねじを締め直します。
    図 17. コールド・プレートねじの締め直し
    Re-torque the cold plate screws
  14. 5 mm の六角ビット・ドライバーで 4 本の六角ソケットねじ (4 x M6、0.7 ニュートン・メーター、6 インチ・ポンド) を緩めてから締め直し、ハンドルとクランプ・ヘッド・アセンブリーの位置を調整します。4 つのコールド・プレートがすべて取り付けられるまで、手順 10 から手順 14 までを繰り返します。
    図 18. ハンドルの調整
    Adjusting handle
  15. ハンドルとクランプ・ヘッド・アセンブリーを調整した後、4 本の六角ソケットねじ (4 x M6、0.7 ニュートン・メーター、6 インチ・ポンド) を固定具に取り付け直します。
    図 19. ねじの再取り付け
    Reattaching screws
  16. すべてのコールド・プレートを取り付けた後で、H100/H200 GPU 保守固定具キットをシャーシから取り外します。
  17. 次の図は、ホース・ホルダーの位置を示しています。
    図 20. ホース・ホルダーの位置
    Hose holder location
  18. ホース・ガイドとホース・ホルダーにホースを配置します。
    1. 背面 H100/H200 GPU コールド・プレート・モジュールのホースおよびケーブルをホース・ガイドに配置し、ホース・タイで固定します。ファン制御ボードのケーブル配線および漏水センサー・モジュールのケーブル配線を参照してください。
      図 21. ホース・タイを使用したホースおよびケーブルの固定
      Securing the hoses and cables with hose ties
    2. 左側背面 H100/H200 GPU コールド・プレート・モジュール・ホースを (1) ホース・ホルダー C に置き、右側背面 H100/H200 GPU コールド・プレート・モジュール・ホースを (2) ホース・ホルダー B に配置します。ホースのガイド・ラベルがホース・ホルダーのマーキングと一致していることを確認します。
      図 22. ホース・ホルダーへのホースの取り付け
      Placing the hoses on hose holders
      1 ホース・ホルダー C (左側)2 ホース・ホルダー B (右側)
      重要
      • 取り付ける前に、ホースおよびホース・ホルダーのガイド・ラベルを確認してください。

  19. 図のように、背面 H100/H200 GPU コールド・プレート・モジュール多岐管を再配置します。
    1. 多岐管を A のマークが付いたガイド・ピンから外します。次に、多岐管を B のマークが付いたガイド・ピンに移動します。
    2. 多岐管ブラケットのガイド・スロットが、B のマークが付いたガイド・ピンにしっかりとかみ合っていることを確認します。
      図 23. 背面 H100/H200 GPU コールド・プレート・モジュール多岐管の再配置
      Repositioning the rear H100/H200 GPU cold plate module manifold
  20. 4 本の M3 ねじ (W7-W8) (PH2、4 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、背面 H100/H200 GPU コールド・プレート・モジュール多岐管をシャーシに固定します。
    図 24. 背面 H100/H200 GPU コールド・プレート・モジュール多岐管の取り付け
    Installing the rear H100/H200 GPU cold plate module manifold
  21. 新しい GPU 複合システムを取り付けた後に背面 H100/H200 GPU コールド・プレート・モジュールを取り付ける場合は、背面ファン・ケージ・サポート・ブラケットを取り付ける前に、NVSwitch コールド・プレート・モジュールと前面 H100/H200 GPU コールド・プレート・モジュールが取り付けられていることを確認します。
  22. 背面ファン・ケージ・サポート・ブラケットを取り付けます。
    1. 背面ファン・ケージ・サポート・ブラケットを対応するねじ穴に合わせます。次に、図のように、背面ファン・ケージ・サポート・ブラケットをホース・ホルダー B/C の上に取り付けます。
    2. 4 本の M3 ねじ (PH2、4 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、背面ファン・ケージ・サポート・ブラケットをファン・ケージに固定します。
    3. 8 本の M3 ねじ (PH2、8 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締めて、背面ファン・ケージ・サポート・ブラケットをシャーシに固定します。
      図 25. 背面ファン・ケージ・サポート・ブラケットの取り付け
      Installing the rear fan cage support bracket

終了後

  1. 取り外してあったすべてのケーブルを再接続します。内部ケーブルの配線を参照してください。
  2. 電源複合システムを再度取り付けます。電源複合システムの取り付けを参照してください。
  3. CPU 複合システムを再び取り付けます。CPU 複合システムの取り付けを参照してください。
  4. ファン・ケージを再び取り付けます。ファン・ケージの取り付け (トレーニングを受けた技術員のみ)を参照してください。
  5. 背面トップ・カバーを再び取り付けます。背面トップ・カバーの取り付けを参照してください。
  6. 前面トップ・カバーを再び取り付けます。前面トップ・カバーの取り付けを参照してください。
  7. 部品交換を完了します。部品交換の完了を参照してください。