Перейти к основному содержимому

Проблемы с производительностью графических процессоров

В случае высоких температур графические процессоры автоматически пропускают такты, что может приводить к снижению производительности. При нормальной работе такого никогда не должно происходить, поскольку XCC постоянно контролирует температуру графических процессоров и соответствующим образом настраивает вентиляторы.

Однако в некоторых ситуациях графические процессоры будут переходить в состояние аварийного снижения (ограничения) потребляемой мощности, что будет негативно влиять на производительность. Эти ситуации перечислены ниже.
  • Потеря питания.

  • Подтверждение регулирования блока питания (обычно происходит при слишком горячем блоке питания).

  • Температура на входе превышает поддерживаемую спецификацию ASHRAE (например 35 °C для ASHRAE A2).

  • Температура на входе превышает 27 °C в сочетании с неисправностью вентилятора.

Чтобы выяснить, не возникла ли какая-либо из таких ситуаций, проверьте состояние светодиодного индикатора системной ошибки и просмотрите журнал событий XClarity Controller на наличие ошибок, связанных с резервированием, ухудшенным состоянием или ограничением питания PCIe.

Чтобы устранить проблему, выполните указанные ниже действия.
  1. Убедитесь, что установлены два блока питания мощностью 2000 Вт, на них подано питание и они находятся в рабочем состоянии (ошибки отсутствуют).

  2. Просмотрите журнал событий XClarity Controller на наличие данных о событиях, связанных с неисправностями вентиляторов. При наличии ошибок замените неисправный вентилятор.

  3. Проверьте температуру окружающей среды в центре обработки данных, где установлен сервер.

  4. Проверьте режим ограничения питания PCIe.