GPU 效能問題
如果溫度過高,GPU 將會自行節流,因而造成效能降低。在正常作業下不應發生這種情況,因為 XCC 會主動監視 GPU 溫度,並據以調整系統風扇。
不過,另外有些情況會造成 GPU 進入緊急減電(電力煞車)狀態,因而影響效能:
電源中斷。
電源供應器節流斷定(通常發生於電源供應器過熱時)。
入口溫度超過支援的 ASHRAE 規格(例如,ASHRAE A2 為 35 °C)。
入口溫度超過 27 °C 並發生風扇故障。
若要監視是否發生上述任一情況,請查看系統錯誤 LED 和 XClarity Controller 事件日誌中與備援、處於欠佳狀態或 PCIe 電力煞車相關的錯誤。
完成下列步驟,以解決此問題:
確定安裝兩個 2000W 電源供應器,電源已開啟,而且運作正常(無錯誤)。
查看 XClarity Controller 事件日誌中與風扇故障相關的事件。如果發生錯誤,則更換故障的風扇。
檢查安裝伺服器之資料中心的環境溫度。
檢查 PCIe 電力煞車模式。
提供意見回饋