メインコンテンツまでスキップ

GPU 電源キャッピング設定 (トレーニングを受けた技術員のみ)

GPU 電源キャッピングについて詳しくは、以下のセクションを参照してください。この手順はトレーニングを受けた技術員のみ行います。

GPU 電源キャッピング・ツール

XCC IPMI コマンドを使用して GPU 電源キャッピングを設定できます。IPMI コマンドについては、以下のセクションを参照してください。

XCC およびファームウェア・バージョン

XCC ファームウェア・バージョンが QGX312Q 以上であることを確認します。XCC ファームウェアを更新するには、ファームウェアの更新を参照してください。

システム・ボードを交換した後の GPU 電源キャッピングのセットアップ

システム・ボードを交換した後は、必ず GPU 電源キャッピングを構成してください。

GPU 電源キャッピング値の読み取り

GPU 電源キャッピング値を読み取るには、IPMI コマンドを使用します。詳しくは、以下を参照してください。

手順:

  1. 以下のコマンド・ラインを使用して、ユーザー定義の GPU 電源キャッピング値を読み取ります:
    ipmitool raw 0x3a 0x6 0xc0 [Slot]
    戻り値は以下のようになります:
    ipmitool raw 0x3a 0x6 0xc0 [Slot]
    [x] [y]
    ここで、
    • [Slot] は GPU の番号です。GPU 1: [Slot]= [3]、GPU 2: [Slot]= [4]、GPU 3: [Slot]= [5]、GPU 4: [Slot]= [6]

    • [x] は 3 桁の 16 進数の第 1 桁で、[y] は 第 2 桁と第 3 桁です。16 進数を 10 進数に変換します。10 進数は電源キャッピング値です。

    たとえば、以下の戻り値は、GPU 3 の電源キャッピング値が 600W であることを示しています。(16 進数 258 から変換)。
    ipmitool raw 0x3a 0x6 0xc0 3
    02 58

    すべての GPU 電源キャッピング値を読み取り、電源キャッピング値をメモします。

    値がfailとして返された場合は、手順 2 に進みます。

  2. (手順 1 で電源キャッピング値を正常に読み取った場合は、手順 2 をスキップします。)

    以下のコマンド・ラインを使用して、デフォルトの GPU 電源キャッピング値を読み取ります:
    ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
    戻り値は以下のようになります:
    ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
    [x] [y]

    ここで、[x] は 3 桁の 16 進数の第 1 桁で、[y] は第 2 桁と第 3 桁です。16 進数を 10 進数に変換します。10 進数は電源キャッピング値です。

    たとえば、以下の戻り値は、GPU 電源キャッピング値が 600W であることを示しています。(16 進数 258 から変換)。
    ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
    02 58

    電源キャッピング値をメモしてください。

IPMI コマンドを使用した GPU 電源キャッピングの構成

  • 4 つの GPU がすべて同じワット数値に電源キャッピングされます。

  • GPU は、以下の 3 つの電源キャッピング値に構成できます。

    • TGP 最大モード: 700W (デフォルト・モード、エンクロージャー内の最大 4 個のトレイ)

    • TGP ユーザー選択済み最適値: 600W (エンクロージャー内の最大 5 個のトレイ)

    • TGP ユーザー選択済み最小値: 500W (エンクロージャー内の最大 6 個のトレイ)

手順:

  1. 電源キャッピング・ワット数値を 10 進数から 16 進数に変換します。

    600W を例として取ると、10 進数 600 の 16 進数への変換値は 258 です

  2. 以下のコマンド・ラインを使用して電源キャッピングを設定します:
    ipmitool raw 0x3a 0x6 0xc0 0xff [x] [y]

    ここで [slot] は GPU の番号です。[x] は変換された 16 進数の第 1 桁で、[y] は第 2 桁と第 3 桁です。

    たとえば、電源キャッピング GPU を 600W に設定するコマンド・ラインは
    ipmitool raw 0x3a 0x6 0xc0 0xff 0x2 0x58
    です
  3. 30 秒から 50 秒後に、次のコマンドで電源キャッピング値を読み取ります:
    ipmitool raw 0x3a 0x6 0xc0 [Slot]
    戻り値は以下のようになります:
    ipmitool raw 0x3a 0x6 0xc0 [Slot]
    [x] [y]
    ここで、
    • [Slot] は GPU の番号です。GPU 1: [Slot]= [3]、GPU 2: [Slot]= [4]、GPU 3: [Slot]= [5]、GPU 4: [Slot]= [6]

    • [x] は 3 桁の 16 進数の第 1 桁で、[y] は 第 2 桁と第 3 桁です。16 進数を 10 進数に変換します。10 進数は電源キャッピング値です。

    たとえば、以下の戻り値は、GPU 3 の電源キャッピング値が 600W であることを示しています。(16 進数 258 から変換)。
    ipmitool raw 0x3a 0x6 0xc0 3
    02 58
  4. すべての GPU 電源キャッピング値を読み取ります。応答電源キャッピング値が誤っている場合は、システムの DC サイクルを実行し、手順 2 を繰り返して値を確認します。エラーが解決しない場合は AC サイクルまたは仮想再取り付けを実行し、再度確認します。