跳至主要内容

GPU 效能問題

如果溫度過高,GPU 將會自行節流,因而造成效能降低。在正常作業下不應發生這種情況,因為 XCC 會主動監視 GPU 溫度,並據以調整系統風扇。

不過,另外有些情況會造成 GPU 進入緊急減電(電力煞車)狀態,因而影響效能:
  • 電源中斷。

  • 電源供應器節流斷定(通常發生於電源供應器過熱時)。

  • 入口溫度超過支援的 ASHRAE 規格(例如,ASHRAE A2 為 35 °C)。

  • 入口溫度超過 27 °C 並發生風扇故障。

若要監視是否發生上述任一情況,請查看系統錯誤 LED 和 XClarity Controller 事件日誌中與備援、處於欠佳狀態或 PCIe 電力煞車相關的錯誤。

完成下列步驟,以解決此問題:
  1. 確定安裝兩個 2000W 電源供應器,電源已開啟,而且運作正常(無錯誤)。

  2. 查看 XClarity Controller 事件日誌中與風扇故障相關的事件。如果發生錯誤,則更換故障的風扇。

  3. 檢查安裝伺服器之資料中心的環境溫度。

  4. 檢查 PCIe 電力煞車模式。