Passa al contenuto principale

Problemi di prestazioni delle GPU

In caso di temperature elevate, le prestazioni delle GPU verranno limitate automaticamente, causando una possibile riduzione delle prestazioni. In condizioni di funzionamento normale ciò non dovrebbe mai accadere, poiché XCC monitora attivamente le temperature delle GPU e regola di conseguenza le ventole di sistema.

Tuttavia, eventuali scenari aggiuntivi comporteranno l'attivazione dello stato Riduzione dell'alimentazione di emergenza (Limitazione alimentazione) delle GPU, che inciderà sulle prestazioni:
  • Un'interruzione dell'alimentazione.

  • Un'asserzione della limitazione dell'alimentatore (generalmente si verifica se la temperatura di un alimentatore è troppo elevata).

  • La temperatura in ingresso supera la specifica ASHRAE supportata (ad esempio, 35 °C per ASHRAE A2).

  • La temperata in ingresso supera 27 °C e si verifica un errore della ventola.

Per monitorare se si verifica uno di questi scenari, controllare sul LED di errore di sistema e nel log eventi di XClarity Controller la presenza di errori relativi a ridondanza, stato danneggiato o interruzione dell'alimentazione PCIe.

Per risolvere il problema, completare le seguenti operazioni:
  1. Assicurarsi che i due alimentatori da 2.000 W siano installati, alimentati e operativi (senza errori).

  2. Controllare nel log eventi di XClarity Controller la presenza di eventi relativi ad errori delle ventole. Se si verificano errori, sostituire la ventola difettosa.

  3. Controllare la temperatura ambiente del data center in cui è installato il server.

  4. Controllare la modalità di interruzione dell'alimentazione PCIe.