メインコンテンツまでスキップ

GPU パフォーマンスの問題

高温の場合、GPU は自己スロットルを行い、パフォーマンスを低下させる場合があります。通常の操作では、XCC が GPU 温度をアクティブに監視し、それに応じてシステム・ファンを調整するため、これは決して発生しません。

ただし、その他のシナリオでは、緊急電力削減 (電源ブレーキ) 状態になり、パフォーマンスに影響します。
  • 電源の消失

  • パワー・サプライ・スロットル・アサーション (通常、パワー・サプライが加熱すると発生します)。

  • 吸気口の温度がサポートされている ASHRAE 仕様を超える (例: ASHRAE A2 で 35° C)。

  • ファンの障害とともに、吸気口の温度が 27 ° を超えています。

これらのシナリオが発生したかどうかを監視するには、システムエラー LED と XClarity Controller イベント・ログで、冗長性、機能低下状態、PCIe 出力ブレーキに関連するエラーを確認します。

この問題を解決するには、以下の手順を実行します。
  1. 2 つの 2,000 W パワー・サプライが取り付けられ、電源が供給され、動作可能 (エラーなし) であることを確認してください。

  2. ファンの障害に関連するイベントについては、XClarity Controller イベント・ログを確認してください。エラーが発生した場合は、障害のあるファンを交換してください。

  3. サーバーが設置されているデータ・センターの周囲温度を確認します。

  4. PCIe 出力ブレーキ・モードを確認します。