メインコンテンツまでスキップ

H100/H200 GPU ベースボードの取り付け

H100/H200 GPU ベースボードの取り付けを行うには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。

このタスクについて

重要
  • 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
  • コンポーネントが入っている帯電防止パッケージを、サーバーの塗装されていない金属面に接触させます。次に、それをパッケージから取り出し、帯電防止板の上に置きます。
  • GPU および GPU ベースボードのコネクターおよびソケットを必ず検査してください。GPU または GPU ベースボードのコネクターが破損しているか足りない場合、あるいはソケットに異物がある場合は、GPU または GPU ボードを使用しないでください。取り付け手順を続行する前に、GPU または GPU ベースボードを新しいものと交換してください。
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
  • Torx T10 プラス・ドライバー
  • Torx T15 プラス・ドライバー
  • #1 プラス・ドライバー
  • #2 プラス・ドライバー
  • マイナス・ドライバー
  • アルコール・クリーニング・パッド
  • 2 x H100/H200 PCM キット
  • 2 x SR780a V3 ウォーター・ループ・パテ・パッド・キット
  • SR780a V3ウォーター・ループ・サービス・キット
  • NVSwitch PCM キット
  • NVSwitch パテ・パッド・キット
  • GPU ベースボード・ハンドル
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
  • 0.6 ニュートン・メーター、5.3 インチ・ポンドに設定できるトルク・ドライバー
ファームウェアとドライバーのダウンロード: コンポーネントの交換後、ファームウェアまたはドライバーの更新が必要になる場合があります。
次の図は、GPU の番号と XCC における対応するスロット番号を示しています。
図 1. GPU 番号付け
GPU numbering

手順

  1. (オプション) パッケージ・ボックスから新しい GPU ベースボードを取り外します。
    1. GPU ベースボードの両側にある 2 つのハンドルを伸ばします。
    2. 2 つのハンドルを持ち、パッケージ・ボックスから GPU ベースボードを取り外します。
    図 2. パッケージ・ボックスから GPU ベースボードを取り外します。
    Removing the GPU baseboard from the package box
  2. GPU ベースボードに GPU を取り付けます。
    1. GPU ベースボードを平らな、静電防止板の上に慎重に置きます。
    2. GPU を GPU ベースボードに慎重に配置します。
    3. 以下の図に示す順序に従って、4 本の Torx T15 ねじを締めて、GPU を GPU ベースボードに固定します。
      まず、トルク・ドライバーを 0.1 ~ 0.12 ニュートン・メーター、0.9 ~ 1.1 インチ・ポンドに設定して、ねじを数ラウンド固定します。次に、トルク・ドライバーを 0.58 ~ 0.62 ニュートン・メーター、5 ~ 5.5 インチ・ポンドに設定して、ねじを完全に締めます。
      図 3. GPU の取り付け
      Installing the GPU
    4. この手順を繰り返して、すべての GPU を取り付けます。
  3. GPU 複合システムを取り付けます。
    1. GPU ベースボードの両側にあるハンドル (1) を図のように正しい向きで持ちます。次に、GPU 複合システムを GPU 複合システム・アダプター・プレート上の 17 個のスタンドオフに位置合わせし、アダプター・プレートに慎重に置きます。
      図 4. GPU 複合システムの取り付け
      GPU complex installation
    2. ハンドルの側面にあるボタンを押します。
    3. ハンドルを調整し、ドライバー用のスペースを作成します。
      図 5. ハンドルの調整
      Adjusting the handle
    4. ハンドルを GPU 複合システムに固定している 5 本の M3 ねじを緩めます。次に、GPU 複合システムからハンドルを取り外します。
      図 6. ハンドルの取り外し
      Removing handles
  4. 以下の図に表示されている順序に従って、17 本の Torx T15 拘束ねじを締めて GPU 複合システムを固定します。
    重要
    損傷を避けるためにねじを締め過ぎないようにしてください。
    トルク・ドライバー・セットでねじを締めたり、緩めたりして、適切なトルクに固定します。参考までに、ねじを完全に締める/緩めるために必要なトルクは 0.6 ニュートン・メーター、5.3 インチ・ポンドです。
    図 7. ねじの取り付け
    Screw installation
  5. GPU コネクター保護ブラケットを対応するねじ穴に合わせます。次に、2 本の M3 ねじ (PH2、2 x M3、0.5 ニュートン・メーター、4.3 インチ・ポンド) を締め、GPU コネクター保護ブラケットをシャーシに固定します。
    図 8. GPU コネクター保護ブラケットの取り付け
    Installing GPU connector protective bracket
  6. PCIe スイッチ・シャトルを取り付けます。
    1. PCIe スイッチ・シャトルの両側にある 2 つのロック・ラッチを押します。
    2. PCIe スイッチ・シャトルを、止まるまでシャーシに押し込みます。
    3. 2 つのリリース・レバーを、所定の位置にロックされるまで回転させます。
      図 9. PCIe スイッチ・シャトルの取り付け
      PCIe switch shuttle installation

終了後

  1. NVswitchコールド・プレート・モジュールを再び取り付けます。NVSwitch コールド・プレート・モジュールの取り付けを参照してください。
  2. 前面 H100/H200 GPU コールド・プレート・モジュールを再び取り付けます。前面 H100/H200 GPU コールド・プレート・モジュールの取り付けを参照してください。
  3. 背面 H100/H200 GPU コールド・プレート・モジュールを再び取り付けます。背面 H100/H200 GPU コールド・プレート・モジュールの取り付けを参照してください。
  4. GPU ベースボードにケーブルを再接続します。詳しくは、GPU ベースボードのケーブル配線を参照してください。
  5. 取り外してあったすべてのケーブルを再接続します。内部ケーブルの配線を参照してください。
  6. 電源複合システムを再度取り付けます。電源複合システムの取り付けを参照してください。
  7. CPU 複合システムを再び取り付けます。CPU 複合システムの取り付けを参照してください。
  8. ファン・ケージを再び取り付けます。ファン・ケージの取り付け (トレーニングを受けた技術員のみ)を参照してください。
  9. 背面トップ・カバーを再び取り付けます。背面トップ・カバーの取り付けを参照してください。
  10. 前面トップ・カバーを再び取り付けます。前面トップ・カバーの取り付けを参照してください。
  11. 部品交換を完了します。部品交換の完了を参照してください。