Skip to main content

ปัญหาเกี่ยวกับประสิทธิภาพ GPU

ในกรณีที่มีอุณหภูมิสูง GPU จะจำกัดตนเอง ซึ่งสามารถทำให้ประสิทธิภาพในการทำงานลดลงได้ เหตุการณ์นี้ไม่ควรเกิดขึ้นภายใต้การทำงานปกติ เนื่องจาก XCC จะตรวจสอบอุณหภูมิของ GPU และปรับพัดลมระบบตามอุณหภูมิอยู่เสมอ

อย่างไรก็ตาม สถานการณ์เพิ่มเติมจะทำให้ GPU เข้าสู่สถานะการลดพลังงานฉุกเฉิน (เบรกพลังงาน) ซึ่งจะส่งผลต่อประสิทธิภาพ:
  • ปัญหาการสูญเสียพลังงาน

  • การยืนยันการจำกัดแหล่งจ่ายไฟ (โดยทั่วไปพบเมื่อแหล่งจ่ายไฟร้อนเกินไป)

  • อุณหภูมิท่อทางเข้าเกินข้อกำหนดของ ASHRAE ที่รองรับ (เช่น 35°C สำหรับ ASHRAE A2)

  • อุณหภูมิท่อทางเข้าเกิน 27°C พร้อมกับพัดลมขัดข้อง

ในการตรวจสอบว่าสถานการณ์เหล่านี้เกิดขึ้นหรือไม่ ให้ตรวจสอบไฟ LED แสดงข้อผิดพลาดของระบบและบันทึกเหตุการณ์ XClarity Controller เพื่อค้นหาข้อผิดพลาดเกี่ยวกับความซ้ำซ้อน สถานะลดความสามารถ หรือการหยุดของพลังงาน PCIe

ดำเนินการตามขั้นตอนต่อไปนี้เพื่อแก้ไขปัญหา:
  1. ตรวจสอบให้แน่ใจว่ามีการติดตั้งแหล่งจ่ายไฟขนาด 2,000W สองชุด ให้พลังงาน และใช้งานได้ (ไม่มีข้อผิดพลาด)

  2. ตรวจสอบบันทึกเหตุการณ์ XClarity Controller เพื่อค้นหาเหตุการณ์ที่เกี่ยวกับพัดลมขัดข้อง หากข้อผิดพลาดเกิดขึ้น ให้เปลี่ยนพัดลมที่ขัดข้อง

  3. ตรวจสอบอุณหภูมิโดยรอบของศูนย์ข้อมูลตัวที่ติดตั้งเซิร์ฟเวอร์

  4. ตรวจสอบโหมดการหยุดพลังงาน PCIe