H100/H200 GPU およびヒートシンク・モジュールの取り付け
H100/H200 GPU およびヒートシンク・モジュールの取り付けを行うには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。
このタスクについて
重要
- 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
- コンポーネントが入っている帯電防止パッケージを、サーバーの塗装されていない金属面に接触させます。次に、それをパッケージから取り出し、帯電防止板の上に置きます。
- この手順は 2 人で実行する必要があります。また、最大 400 ポンド (181kg) を支えることができるリフト・デバイス 1 台が必要です。リフト・デバイスがまだ手元にない場合、Lenovo では Data Center Solution Configurator で購入していただける Genie Lift GL-8 material lift をご用意しています。Genie Lift GL-8 material lift を注文される際は、フットリリース・ブレーキとロード・プラットフォームが含まれていることを確認してください。
- GPU および GPU ベースボード 上のコネクターおよびソケットを必ず検査してください。GPU または GPU ベースボード のコネクターが破損しているか足りない場合、あるいはソケットに異物がある場合は、GPU または GPU ボードを使用しないでください。取り付け手順を続行する前に、GPU または GPU ベースボード を新しいものと交換してください。
- GPU および ヒートシンク は 1 つの部品です。GPU からヒートシンクを取り外さないでください。
- 次の表は、物理 GPU ソケット、XCC のスロット番号、および nvidia-smi のモジュール ID のマッピング情報を示しています。
物理 GPU ソケット XCC のスロット番号付け nvidia-smi のモジュール ID SXM 1 スロット 21 1 SXM 2 スロット 24 2 SXM 3 スロット 22 3 SXM 4 スロット 23 4 SXM 5 スロット 17 5 SXM 6 スロット 20 6 SXM 7 スロット 18 7 SXM 8 スロット 19 8
注
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
- 0.1 ~ 0.62 ニュートン・メーター、0.9 ~ 5.5 インチ・ポンドに設定できるトルク・ドライバー
- Torx T15 拡張ビット (長さ 200 mm)
- H100/H200 治具
ファームウェアとドライバーのダウンロード: コンポーネントの交換後、ファームウェアやドライバーの更新が必要になる場合があります。
ご使用のサーバーでのファームウェアとドライバーの最新の更新を確認するには、ThinkSystem SR685a V3 用のドライバーおよびソフトウェアのダウンロード Web サイト を参照してください。
ファームウェア更新ツールについて詳しくは、ファームウェアの更新を参照してください。
手順
完了したら
- (GPU および ヒートシンク・モジュール 2、4、5、および 7 のみ) GPU エアー・ダクトを再度取り付けます。H100/H200 GPU エアー・ダクトの取り付けを参照してください。
- 電源複合システム を再度取り付けます。電源複合システムの取り付けを参照してください。
- 8U GPU シャトルを再度取り付けます。8U GPU シャトルの取り付けを参照してください。
- すべての 2.5 インチ ホット・スワップ・ドライブまたはドライブ・ベイ・フィラー (搭載されている場合) をドライブ・ベイに再度取り付けます。2.5 インチ ホット・スワップ・ドライブの取り付け
- すべての前面ファンを再度取り付けます。ホット・スワップ・ファン (前面と背面) の取り付けを参照してください。
- すべてのパワー・サプライ・ユニットを再取り付けします。ホット・スワップ・パワー・サプライ・ユニットの取り付けを参照してください。
- 部品交換を完了します。部品交換の完了を参照してください。
フィードバックを送る