H100/H200 GPU ベースボードの取り付け
H100/H200 GPU ベースボードの取り付けを行うには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。
このタスクについて
重要
- 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
 - コンポーネントが入っている帯電防止パッケージを、サーバーの塗装されていない金属面に接触させます。次に、それをパッケージから取り出し、帯電防止板の上に置きます。
 - GPU および GPU ベースボードのコネクターおよびソケットを必ず検査してください。GPU または GPU ベースボードのコネクターが破損しているか足りない場合、あるいはソケットに異物がある場合は、GPU または GPU ボードを使用しないでください。取り付け手順を続行する前に、GPU または GPU ベースボードを新しいものと交換してください。
 
注
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
- Torx T10 プラス・ドライバー
 - Torx T15 プラス・ドライバー
 - #1 プラス・ドライバー
 - #2 プラス・ドライバー
 - マイナス・ドライバー
 - アルコール・クリーニング・パッド
 - 2 x H100/H200 PCM キット
 - 2 x SR780a V3 H100/H200 ウォーター・ループ・パテ・パッド・キット
 - SR780a V3 H100/H200 ウォーター・ループ・サービス・キット
 - H100/H200 GPU 保守固定具キット
 - H100/H200 NVSwitch PCM キット
 - H100/H200 NVSwitch パテ・パッド・キット
 - H100/H200 GPU ベースボード・ハンドル・キット
 - Torx T25 150mm 延長ビット (GPU ベースボード・ハンドル用)
 
注
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
- 0.6 ニュートン・メーター、5.3 インチ・ポンドに設定できるトルク・ドライバー
 
ファームウェアとドライバーのダウンロード: コンポーネントの交換後、ファームウェアやドライバーの更新が必要になる場合があります。
ご使用のサーバーでのファームウェアとドライバーの最新の更新を確認するには、ThinkSystem SR780a V3 用のドライバーおよびソフトウェアのダウンロード Web サイト を参照してください。
ファームウェア更新ツールについて詳しくは、ファームウェアの更新を参照してください。
次の図は、GPU の番号と XCC における対応するスロット番号を示しています。
図 1. GPU 番号付け


| 物理 GPU ソケット | XCC のスロット番号付け | nvidia-smi の論理番号 | 
|---|---|---|
GPU 1  | スロット 21  | 1  | 
GPU 2  | スロット 24  | 2  | 
GPU 3  | スロット 22  | 0  | 
GPU 4  | スロット 23  | 3  | 
GPU 5  | スロット 17  | 5  | 
GPU 6  | スロット 20  | 6  | 
GPU 7  | スロット 18  | 4  | 
GPU 8  | スロット 19  | 7  | 
手順
完了したら
- NVSwitch コールド・プレート・モジュールを再度取り付けます。H100/H200 NVSwitch コールド・プレート・モジュールの取り付けを参照してください。
 - 前面 H100/H200 GPU コールド・プレート・モジュールを再度取り付けます。前面 H100/H200 GPU コールド・プレート・モジュールの取り付けを参照してください。
 - 背面 H100/H200 GPU コールド・プレート・モジュールを再度取り付けます。背面 H100/H200 GPU コールド・プレート・モジュールの取り付けを参照してください。
 - GPU ベースボードにケーブルを再接続します。詳しくは、GPU ベースボードのケーブル配線を参照してください。
 - 取り外してあったすべてのケーブルを再接続します。内部ケーブルの配線を参照してください。
 - 電源複合システムを再度取り付けます。電源複合システムの取り付けを参照してください。
 - CPU 複合システムを再度取り付けます。CPU 複合システムの取り付けを参照してください。
 - ファン・ケージを再度取り付けます。ファン・ケージの取り付け (トレーニングを受けた技術員のみ)を参照してください。
 - 背面トップ・カバーを再度取り付けます。背面トップ・カバーの取り付けを参照してください。
 - 前面トップ・カバーを再度取り付けます。前面トップ・カバーの取り付けを参照してください。
 - 部品交換を完了します。部品交換の完了を参照してください。
 
フィードバックを送る
 GPU ベースボードの両側にある 2 つのハンドルを伸ばします。
 2 つのハンドルを持ち、パッケージ・ボックスから GPU ベースボードを取り外します。


 以下の図に示す順序に従って、4 本の Torx T15 ねじを締めて、GPU を GPU ベースボードに固定します。





