GPU 電源キャッピング設定 (トレーニングを受けた技術員のみ)
GPU 電源キャッピングについて詳しくは、以下のセクションを参照してください。この手順はトレーニングを受けた技術員のみ行います。
GPU 電源キャッピング・ツール
XCC IPMI コマンドを使用して GPU 電源キャッピングを設定できます。IPMI コマンドについては、以下のセクションを参照してください。
XCC ファームウェア・バージョンが QGX312Q 以上であることを確認します。XCC ファームウェアを更新するには、ファームウェアの更新を参照してください。
システム・ボードを交換した後の GPU 電源キャッピングのセットアップ
交換した GPU と同じ GPU 電源キャッピング値に従うには、以下を行います。
サーバーの電源をオフにする前に、GPU 電源キャッピング値を読み取ります。GPU 電源キャッピング値の読み取りを参照してください。
サーバーの電源をオンにした後で、GPU 電源キャッピング値を構成します。IPMI コマンドを使用した GPU 電源キャッピングの構成を参照してください。
新しい電源キャッピング値を設定するには、IPMI コマンドを使用した GPU 電源キャッピングの構成にアクセスしてください。
GPU 電源キャッピング値の読み取り
GPU 電源キャッピング値を読み取るには、IPMI コマンドを使用します。詳しくは、以下を参照してください。
手順:
- 以下のコマンド・ラインを使用して、ユーザー定義の GPU 電源キャッピング値を読み取ります:
戻り値は以下のようになります:ipmitool raw 0x3a 0x6 0xc0 [Slot]
ipmitool raw 0x3a 0x6 0xc0 [Slot]
[x] [y]ここで、[Slot] は GPU の番号です。GPU 1: [Slot]= [3]、GPU 2: [Slot]= [4]、GPU 3: [Slot]= [5]、GPU 4: [Slot]= [6]
[x] は 3 桁の 16 進数の第 1 桁で、[y] は 第 2 桁と第 3 桁です。16 進数を 10 進数に変換します。10 進数は電源キャッピング値です。
たとえば、以下の戻り値は、GPU 3 の電源キャッピング値が 600W であることを示しています。(16 進数 258 から変換)。ipmitool raw 0x3a 0x6 0xc0 3
02 58すべての GPU 電源キャッピング値を読み取り、電源キャッピング値をメモします。
値が
fail
として返された場合は、手順 2 に進みます。 (手順 1 で電源キャッピング値を正常に読み取った場合は、手順 2 をスキップします。)
以下のコマンド・ラインを使用して、デフォルトの GPU 電源キャッピング値を読み取ります:ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
戻り値は以下のようになります:ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
[x] [y]ここで、[x] は 3 桁の 16 進数の第 1 桁で、[y] は第 2 桁と第 3 桁です。16 進数を 10 進数に変換します。10 進数は電源キャッピング値です。
たとえば、以下の戻り値は、GPU 電源キャッピング値が 600W であることを示しています。(16 進数 258 から変換)。ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
02 58電源キャッピング値をメモしてください。
IPMI コマンドを使用した GPU 電源キャッピングの構成
4 つの GPU がすべて同じワット数値に電源キャッピングされます。
GPU は、以下の 3 つの電源キャッピング値に構成できます。
TGP 最大モード: 700W (デフォルト・モード、エンクロージャー内の最大 4 個のトレイ)
TGP ユーザー選択済み最適値: 600W (エンクロージャー内の最大 5 個のトレイ)
TGP ユーザー選択済み最小値: 500W (エンクロージャー内の最大 6 個のトレイ)
手順:
電源キャッピング・ワット数値を 10 進数から 16 進数に変換します。
600W を例として取ると、10 進数 600 の 16 進数への変換値は 258 です
- 以下のコマンド・ラインを使用して電源キャッピングを設定します:
ipmitool raw 0x3a 0x6 0xc0 0xff [x] [y]
ここで [slot] は GPU の番号です。[x] は変換された 16 進数の第 1 桁で、[y] は第 2 桁と第 3 桁です。
たとえば、電源キャッピング GPU を 600W に設定するコマンド・ラインは
ですipmitool raw 0x3a 0x6 0xc0 0xff 0x2 0x58
- 30 秒から 50 秒後に、次のコマンドで電源キャッピング値を読み取ります:
ipmitool raw 0x3a 0x6 0xc0 [Slot]
戻り値は以下のようになります:ipmitool raw 0x3a 0x6 0xc0 [Slot]
[x] [y]ここで、[Slot] は GPU の番号です。GPU 1: [Slot]= [3]、GPU 2: [Slot]= [4]、GPU 3: [Slot]= [5]、GPU 4: [Slot]= [6]
[x] は 3 桁の 16 進数の第 1 桁で、[y] は 第 2 桁と第 3 桁です。16 進数を 10 進数に変換します。10 進数は電源キャッピング値です。
たとえば、以下の戻り値は、GPU 3 の電源キャッピング値が 600W であることを示しています。(16 進数 258 から変換)。ipmitool raw 0x3a 0x6 0xc0 3
02 58 すべての GPU 電源キャッピング値を読み取ります。応答電源キャッピング値が誤っている場合は、システムの DC サイクルを実行し、手順 2 を繰り返して値を確認します。エラーが解決しない場合は AC サイクルまたは仮想再取り付けを実行し、再度確認します。