メインコンテンツまでスキップ

H100/H200 GPU ベースボードの取り外し

H100/H200 GPU ベースボードの取り外しを行うには、このセクションの説明に従ってください。この手順は、トレーニングを受けた技術者が行う必要があります。

このタスクについて

重要
  • 安全に作業を行うために、取り付けのガイドラインおよび 安全検査のチェックリストをお読みください。
  • サーバーと周辺機器の電源をオフにし、電源コードとすべての外部ケーブルを取り外します。サーバーの電源をオフにするを参照してください。
  • サーバーをラックに取り付けている場合は、ラックからサーバーを取り外します。ラックからのサーバーの取り外しを参照してください。
  • この手順は 2 人で実行する必要があります。また、最大 400 ポンド (181kg) を支えることができるリフト・デバイス 1 台が必要です。リフト・デバイスがまだ手元にない場合、Lenovo では Data Center Solution Configurator で購入していただける Genie Lift GL-8 material lift をご用意しています。Genie Lift GL-8 material lift を注文される際は、フットリリース・ブレーキとロード・プラットフォームが含まれていることを確認してください。
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
  • Torx T10 プラス・ドライバー
  • Torx T15 プラス・ドライバー
  • #1 プラス・ドライバー
  • #2 プラス・ドライバー
  • マイナス・ドライバー
  • アルコール・クリーニング・パッド
  • 2 x H100/H200 PCM キット
  • 2 x SR780a V3 ウォーター・ループ・パテ・パッド・キット
  • SR780a V3ウォーター・ループ・サービス・キット
  • NVSwitch PCM キット
  • NVSwitch パテ・パッド・キット
  • GPU ベースボード・ハンドル
コンポーネントを適切に交換するために、以下にリストされている必要なツールが利用できることを確認してください:
  • 0.6 ニュートン・メーター、5.3 インチ・ポンドに設定できるトルク・ドライバー
次の図は、GPU の番号と XCC における対応するスロット番号を示しています。
図 1. GPU 番号付け
GPU numbering

手順

  1. このタスクの準備をします。
    1. 前面トップ・カバーを取り外します。前面トップ・カバーの取り外しを参照してください。
    2. 背面トップ・カバーを取り外します。背面トップ・カバーの取り外しを参照してください。
    3. ファン・ケージを取り外します。ファン・ケージの取り外し (トレーニングを受けた技術員のみ)を参照してください。
    4. CPU 複合システムを取り外します。CPU 複合システムの取り外しを参照してください。
    5. 電源複合システムを取り外します。電源複合システムの取り外しを参照してください。
    6. GPU ベースボードからケーブルを外します。
    7. 必要に応じて、GPU 複合システムを通して配線されたケーブルを切り離し、取り外します。ケーブルを外す前に、各ケーブルのリストを作成し、ケーブルが接続されているコネクタを記録します。内部ケーブルの配線を参照してください。
    8. 背面 H100/H200 GPU コールド・プレート・モジュールを取り外します。背面 H100/H200 GPU コールド・プレート・モジュールの取り外しを参照してください。
    9. 前面 H100/H200 GPU コールド・プレート・モジュールを取り外します。前面 H100/H200 GPU コールド・プレート・モジュールの取り外しを参照してください。
    10. NVswitch コールド・プレート・モジュールを取り外します。NVSwitch コールド・プレート・モジュールの取り外しを参照してください。
  2. PCIe スイッチ・シャトルをシャーシから取り外します。
    1. 青色の 2 つのリリース・ラッチを押します。
    2. 2 つのリリース・レバーを、PCIe スイッチ・シャトルに対して垂直になるまで回転させます。
    3. PCIe スイッチ・シャトルを停止するまで前方に引きます。
      損傷を避けるために、2 つのリリース・レバーを、PCIe スイッチ・シャトルから引き出した後、所定の位置にロックされるまで押して元に戻します。
      図 2. 停止位置への PCIe スイッチ・シャトルの取り外し
      PCIe switch shuttle removal to stop position
  3. 2 本の M3 ねじを緩めて、GPU コネクター保護ブラケットを取り外します。
    図 3. GPU コネクター保護ブラケットの取り外し
    Removing the GPU connector protective bracket
  4. GPU ベースボードの 17 本の Torx T15 拘束ねじを緩めます。
    トルク・ドライバー・セットでねじを締めたり、緩めたりして、適切なトルクに固定します。参考までに、ねじを完全に締める/緩めるために必要なトルクは 0.6 ニュートン・メーター、5.3 インチ・ポンドです。
    図 4. ねじの取り外し
    Screw removal
  5. GPU 複合システムを取り外します。
    1. ハンドルの側面にあるボタンを押します。
    2. ハンドルを調整し、ドライバー用のスペースを作成します。
      図 5. ハンドルの調整
      Adjusting the handle
    3. ハンドルをねじ穴に合わせ、GPU ベースボードに下ろします。次に、5 本の M3 ねじ (5 x M3、0.5 ニュートン・メートル、4.3 インチ・ポンド) を締めて、ハンドルを GPU ベースボードに固定します。
      図 6. ハンドルの取り付け
      Installing the handles
    4. 2 つのハンドル (1) を持ち、GPU 複合システムを持ち上げてシャーシから取り出します。
    重要
    GPU 複合システムの両側に 2 人が立っていることを確認し、2 つのハンドル (1) を持って持ち上げます。
    図 7. GPU 複合システムの取り外し
    Removing the GPU complex
  6. GPU 複合システムを平らな帯電防止板にゆっくり置いた後、ハンドルをベースボードに固定している 5 本の M3 ねじを緩めます。ハンドルを持ち上げてベースボードから取り外します。
    図 8. ハンドルの取り外し
    Removing handles
  7. GPU ベースボードから GPU を取り外します。
    1. GPU 複合システムを平らな静電防止面に慎重に置きます。
    2. 以下の図に示されている順序に従って、4 本の Torx T15 ねじを緩めます。
      トルク・ドライバー・セットでねじを緩めて、適切なトルクに固定します。参考までに、ねじを完全に緩めるために必要なトルクは 0.6 ニュートン・メーター、5.3 インチ・ポンドです。
    3. GPU ベースボードから GPU をゆっくり取り外します。
      図 9. GPU の取り外し
      Removing the GPU
    4. この手順を繰り返して、すべての GPU を取り外します。

終了後

  1. 交換用ユニットを取り付けます。H100/H200 GPU ベースボードの取り付けを参照してください。
  2. コンポーネントまたはオプション装置を返却するよう指示された場合は、すべての梱包上の指示に従い、提供された配送用の梱包材がある場合はそれを使用してください。