H100/H200 GPU ベースボードの取り付け
H100/H200 GPU ベースボードの取り付けを行うには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。
このタスクについて
重要
- 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
- コンポーネントが入っている帯電防止パッケージを、サーバーの塗装されていない金属面に接触させます。次に、それをパッケージから取り出し、帯電防止板の上に置きます。
- GPU および GPU ベースボードのコネクターおよびソケットを必ず検査してください。GPU または GPU ベースボードのコネクターが破損しているか足りない場合、あるいはソケットに異物がある場合は、GPU または GPU ボードを使用しないでください。取り付け手順を続行する前に、GPU または GPU ベースボードを新しいものと交換してください。
注
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
- Torx T10 プラス・ドライバー
- Torx T15 プラス・ドライバー
- #1 プラス・ドライバー
- #2 プラス・ドライバー
- マイナス・ドライバー
- アルコール・クリーニング・パッド
- 2 x H100/H200 PCM キット
- 2 x SR780a V3 ウォーター・ループ・パテ・パッド・キット
- SR780a V3ウォーター・ループ・サービス・キット
- NVSwitch PCM キット
- NVSwitch パテ・パッド・キット
- GPU ベースボード・ハンドル
注
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
- 0.6 ニュートン・メーター、5.3 インチ・ポンドに設定できるトルク・ドライバー
ファームウェアとドライバーのダウンロード: コンポーネントの交換後、ファームウェアまたはドライバーの更新が必要になる場合があります。
ご使用のサーバーでのファームウェアとドライバーの最新の更新を確認するには、ThinkSystem SR780a V3 用のドライバーおよびソフトウェアのダウンロード Web サイト を参照してください。
ファームウェア更新ツールについては、ファームウェアの更新を参照してください。
次の図は、GPU の番号と XCC における対応するスロット番号を示しています。
図 1. GPU 番号付け
手順
終了後
- NVswitchコールド・プレート・モジュールを再び取り付けます。NVSwitch コールド・プレート・モジュールの取り付けを参照してください。
- 前面 H100/H200 GPU コールド・プレート・モジュールを再び取り付けます。前面 H100/H200 GPU コールド・プレート・モジュールの取り付けを参照してください。
- 背面 H100/H200 GPU コールド・プレート・モジュールを再び取り付けます。背面 H100/H200 GPU コールド・プレート・モジュールの取り付けを参照してください。
- GPU ベースボードにケーブルを再接続します。詳しくは、GPU ベースボードのケーブル配線を参照してください。
- 取り外してあったすべてのケーブルを再接続します。内部ケーブルの配線を参照してください。
- 電源複合システムを再度取り付けます。電源複合システムの取り付けを参照してください。
- CPU 複合システムを再び取り付けます。CPU 複合システムの取り付けを参照してください。
- ファン・ケージを再び取り付けます。ファン・ケージの取り付け (トレーニングを受けた技術員のみ)を参照してください。
- 背面トップ・カバーを再び取り付けます。背面トップ・カバーの取り付けを参照してください。
- 前面トップ・カバーを再び取り付けます。前面トップ・カバーの取り付けを参照してください。
- 部品交換を完了します。部品交換の完了を参照してください。
フィードバックを送る