GPU 성능 문제
고온에서 작동하는 경우 GPU는 자체 스로틀링되며 이로 인해 성능이 저하될 수 있습니다. XCC는 GPU 온도를 능동적으로 모니터링하고 그에 따라 시스템 팬을 조정하므로 정상적인 운영 환경에서는 이러한 문제가 발생하지 않습니다.
그러나 추가 시나리오에서는 GPU가 비상 전원 감소(전원 브레이크) 상태가 되어 성능에 영향을 줍니다.
전력 유실.
전원 공급 장치 스로틀 어설션(일반적으로 전원 공급 장치가 너무 뜨거울 때 발생함).
흡입구 온도가 지원되는 ASHRAE 사양(예: ASHRAE A2의 경우 35°C)을 초과합니다.
팬 장애가 함께 발생한 경우 흡입구 온도가 27°C를 초과합니다.
이러한 시나리오가 발생했는지 여부를 모니터링하려면 시스템 오류 LED 및 XClarity Controller 이벤트 로그에서 중복성, 저성능 상태 또는 PCIe 전원 브레이크와 관련된 오류를 확인하십시오.
다음 단계를 완료하여 문제를 해결하십시오.
2개의 2000W 전원 공급 장치가 설치되어 전원이 공급되고 작동하는지(오류 없음) 확인하십시오.
XClarity Controller 이벤트 로그에서 팬 장애와 관련된 이벤트를 확인하십시오. 오류가 발생한 경우 장애가 발생한 팬을 교체하십시오.
서버가 설치된 데이터 센터의 주변 온도를 확인하십시오.
PCIe 전원 브레이크 모드를 확인하십시오.
피드백 보내기