Skip to main content

ปัญหาเกี่ยวกับหน่วยความจำ

ใช้ข้อมูลนี้ในการแก้ไขปัญหาเกี่ยวกับหน่วยความจำ

หน่วยความจำระบบที่แสดงน้อยกว่าหน่วยความจำจริงที่ติดตั้ง

ทำขั้นตอนต่อไปนี้ให้ครบถ้วนจนกว่าปัญหาจะได้รับการแก้ไข:
หมายเหตุ
ทุกครั้งที่คุณติดตั้งหรือถอดโมดูลหน่วยความจำ คุณต้องถอดเซิร์ฟเวอร์ออกจากแหล่งพลังงาน จากนั้นรอ 10 วินาทีแล้วจึงเริ่มระบบของเซิร์ฟเวอร์ใหม่
  1. ตรวจสอบให้แน่ใจว่า:
    • ไฟ LED แสดงข้อผิดพลาดบนแผงข้อมูลของตัวดำเนินการไม่ติดสว่าง

    • ไฟ LED แสดงข้อผิดพลาดของโมดูลหน่วยความจำบนแผงระบบไม่ติดสว่าง

    • Mirrored-Channel ของหน่วยความจำไม่อธิบายความขัดแย้ง

    • เสียบโมดูลหน่วยความจำอย่างถูกต้อง

    • คุณได้ติดตั้งประเภทของโมดูลหน่วยความจำที่ถูกต้อง (ดู ข้อมูลจำเพาะ หรือ การติดตั้ง DC Persistent Memory Module (DCPMM) สำหรับข้อกำหนด)

    • หลังจากเปลี่ยนโมดูลหน่วยความจำ การกำหนดค่าหน่วยความจำจะถูกอัปเดตใน Setup Utility ตามไปด้วย

    • เปิดใช้แบงค์หน่วยความจำครบทุกกลุ่มแล้ว เซิร์ฟเวอร์อาจปิดใช้งานแบงค์หน่วยความจำโดยอัตโนมัติเมื่อตรวจพบปัญหา หรือมีการปิดใช้งานแบงค์หน่วยความจำด้วยตนเอง

    • ไม่พบหน่วยความจำที่ไม่ตรงกันเมื่อเซิร์ฟเวอร์กำหนดค่าหน่วยความจำขั้นต่ำ

    • เมื่อมีการติดตั้ง DCPMM:

      1. หากตั้งค่าหน่วยความจำในโหมด App Direct หรือโหมดหน่วยความจำผสม ข้อมูลที่บันทึกไว้ทั้งหมดจะได้รับการสำรอง และ Namespace ที่สร้างไว้ทั้งหมดจะถูกก่อนที่จะเปลี่ยน DCPMM

      2. โปรดดู การติดตั้ง DC Persistent Memory Module (DCPMM) และดูว่าหน่วยความจำที่แสดงนั้นตรงกับคำอธิบายของโหมด

      3. หากเพิ่งตั้งค่า DCPMM ในโหมดหน่วยความจำ ให้ย้อนกลับไปที่โหมด App Direct และตรวจดูว่ามี Namespace ที่ยังไม่ได้ลบหรือไม่ (โปรดดู การติดตั้ง DC Persistent Memory Module (DCPMM))

      4. ไปที่ Setup Utility แล้วเลือก System Configuration and Boot Management > Intel Optane DCPMMs > Security และตรวจสอบให้แน่ใจว่าหน่วย DCPMM ทั้งหมดปลดล็อคอยู่

  2. ใส่โมดูลหน่วยความจำให้แน่น แล้วรีสตาร์ทเซิร์ฟเวอร์

  3. ตรวจสอบบันทึกข้อผิดพลาด POST:

    • หากโมดูลหน่วยความจำถูกปิดใช้งานโดยการรบกวนการจัดการระบบ (SMI) ให้เปลี่ยนโมดูลหน่วยความจำ

    • หากโมดูลหน่วยความจำถูกปิดใช้งานโดยผู้ใช้หรือโดย POST ให้เสียบโมดูลหน่วยความจำอีกครั้ง จากนั้นเรียกใช้ Setup Utility แล้วจึงเปิดใช้งานโมดูลหน่วยความจำ

  4. เรียกใช้การวินิจฉัยหน่วยความจำ เมื่อคุณเริ่มต้นระบบเครื่องและกดปุ่มตามคำแนะนำบนหน้าจอ อินเทอร์เฟซ LXPM จะแสดงตามค่าเริ่มต้น (สำหรับข้อมูลเพิ่มเติม โปรดดูส่วน “เริ่มต้นระบบ” ในเอกสาร LXPM ที่ใช้ได้กับเซิร์ฟเวอร์ของคุณที่ หน้าพอร์ทัล Lenovo XClarity Provisioning Manager) คุณสามารถดำเนินการวินิจฉัยหน่วยความจำด้วยอินเทอร์เฟซนี้ จากหน้าการวินิจฉัย ให้ไปที่ Run Diagnostic > Memory test หรือ DCPMM test

    หมายเหตุ
    เมื่อติดตั้ง DCPMM แล้ว ให้เรียกใช้การวินิจฉัยตามโหมดที่ตั้งค่าอยู่ในปัจจุบัน
    • โหมด App Direct:

      • รันการทดสอบหน่วยความจำสำหรับโมดูลหน่วยความจำ DRAM

      • เรียกใช้การทดสอบ DCPMM สำหรับ DCPMM

    • โหมดหน่วยความจำและโหมดหน่วยความจำผสม:

      เรียกใช้ทั้งการทดสอบหน่วยความจำและการทดสอบ DCPMM สำหรับ DCPMM

  5. ย้อนกลับโมดูลระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง
    หมายเหตุ
    เมื่อติดตั้ง DCPMM แล้ว ให้ใช้วิธีนี้ในโหมดหน่วยความจำเท่านั้น
  6. เปิดใช้งานโมดูลหน่วยความจำทั้งหมดอีกครั้งโดยใช้ Setup utility แล้วเริ่มระบบเซิร์ฟเวอร์ใหม่

  7. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ

  8. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ

โมดูลหน่วยความจำในช่องจำนวนหลายตัวถูกระบุว่ามีความบกพร่อง

หมายเหตุ
ทุกครั้งที่คุณติดตั้งหรือถอดโมดูลหน่วยความจำ คุณต้องถอดเซิร์ฟเวอร์ออกจากแหล่งพลังงาน จากนั้นรอ 10 วินาทีแล้วจึงเริ่มระบบของเซิร์ฟเวอร์ใหม่
  1. ใส่โมดูลหน่วยความจำ แล้วรีสตาร์ทเซิร์ฟเวอร์
  2. ถอดโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุออก และเปลี่ยนใหม่ด้วยโมดูลหน่วยความจำที่ใช้งานได้หมายเลขเดียวกัน แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น หากความล้มเหลวยังคงอยู่หลังจากเปลี่ยนโมดูลหน่วยความจำที่ระบุทั้งหมดแล้ว ให้ไปที่ขั้นตอนที่ 4
  3. ใส่โมดูลหน่วยความจำที่ถอดออกมากลับไปยังขั้วต่อเดิมทีละหน่วย รีสตาร์ทเซิร์ฟเวอร์หลังจากใส่โมดูลหน่วยความจำแต่ละหน่วย จนกว่าโมดูลหน่วยความจำจะทำงานบกพร่อง เปลี่ยนโมดูลหน่วยความจำที่บกพร่องแต่ละหน่วยด้วยโมดูลหน่วยความจำที่ใช้งานได้ รีสตาร์ทเซิร์ฟเวอร์หลังจากเปลี่ยนโมดูลหน่วยความจำแต่ละครั้ง ทำซ้ำขั้นตอนที่ 3 จนกว่าคุณจะทดสอบโมดูลหน่วยความจำที่ถอดออกมาหมดทุกหน่วย
  4. เปลี่ยนโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุ แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น
  5. ย้อนกลับโมดูลหน่วยความจำระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง
  6. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ
  7. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ

ความพยายามเปลี่ยนเป็นโหมด DCPMM อื่นไม่สำเร็จ

หลังจากโหมด DCPMM เปลี่ยนและระบบจะรีสตาร์ทสำเร็จแล้ว หากโหมด DCPMM ยังคงเดิมอยู่แทนที่จะเปลี่ยนไป ให้ตรวจสอบจุ DRAM DIMM และความจุของ DCPMM เพื่อดูว่าตรงตามเกณฑ์ของโหมดใหม่หรือไม่ (ดู การติดตั้ง DC Persistent Memory Module (DCPMM))

Namespace เพิ่มเติมปรากฏขึ้นมาในพื้นที่แบบ Interleave

หากมีสอง Namespace ที่สร้างขึ้นอยู่ในพื้นที่แบบ Interleave หนึ่ง VMware ESXi จะละเว้น Namespace ที่สร้างขึ้น และสร้าง Namespace เพิ่มขึ้นมาใหม่อีกหนึ่งระหว่างการบูตระบบ ให้ลบ Namespace ที่สร้างขึ้น ใน Setup Utility หรือในระบบปฏิบัติการ ก่อนการบูตครั้งแรกด้วย ESXi