Skip to main content

ปัญหาเกี่ยวกับหน่วยความจำ

โปรดดูวิธีแก้ไขปัญหาเกี่ยวกับหน่วยความจำที่ส่วนนี้

โมดูลหน่วยความจำหลายโมดูลถูกระบุว่ามีความบกพร่องหรือปิดใช้งานอยู่

ทำขั้นตอนต่อไปนี้ให้ครบถ้วนเพื่อแก้ไขปัญหา

  1. ตรวจสอบบันทึก XCC เพื่อดูว่าโมดูลที่ปิดใช้งานตัวใดตัวหนึ่งบกพร่องหรือไม่ หากเป็นเช่นนั้น ให้เปลี่ยนโมดูลที่บกพร่องและเริ่มระบบเพื่อดูว่าโมดูลทั้งหมดได้รับการตรวจพบอย่างถูกต้องหรือไม่
    หมายเหตุ
    เมื่อหน่วยความจำหนึ่งโมดูลทำงานบกพร่อง ระบบจะดำเนินการดาวน์เกรดหน่วยความจำเป็นรูปแบบที่รองรับที่ใกล้เคียงที่สุด ในขณะที่โมดูลหน่วยความจำที่ติดตั้งบางตัวจะไม่ถูกตรวจพบโดยระบบ
  2. ใส่โมดูลหน่วยความจำ แล้วรีสตาร์ทเซิร์ฟเวอร์
  3. ถอดโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุออก และเปลี่ยนใหม่ด้วยโมดูลหน่วยความจำที่ใช้งานได้หมายเลขเดียวกัน แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น หากความล้มเหลวยังคงอยู่หลังจากเปลี่ยนโมดูลหน่วยความจำที่ระบุทั้งหมดแล้ว ให้ไปที่ขั้นตอนที่ 4
  4. ใส่โมดูลหน่วยความจำที่ถอดออกมากลับไปยังขั้วต่อเดิมทีละหน่วย รีสตาร์ทเซิร์ฟเวอร์หลังจากใส่โมดูลหน่วยความจำแต่ละหน่วย จนกว่าโมดูลหน่วยความจำจะทำงานบกพร่อง เปลี่ยนโมดูลหน่วยความจำที่บกพร่องแต่ละหน่วยด้วยโมดูลหน่วยความจำที่ใช้งานได้ รีสตาร์ทเซิร์ฟเวอร์หลังจากเปลี่ยนโมดูลหน่วยความจำแต่ละครั้ง ทำซ้ำขั้นตอนที่ 3 จนกว่าคุณจะทดสอบโมดูลหน่วยความจำที่ถอดออกมาหมดทุกหน่วย
  5. เปลี่ยนโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุ แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น
  6. ย้อนกลับโมดูลหน่วยความจำระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง
  7. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ
  8. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ

หน่วยความจำระบบที่แสดงน้อยกว่าหน่วยความจำจริงที่ติดตั้ง

ทำขั้นตอนต่อไปนี้ให้ครบถ้วนเพื่อแก้ไขปัญหา

หมายเหตุ
ทุกครั้งที่คุณติดตั้งหรือถอดโมดูลหน่วยความจำ คุณต้องถอดเซิร์ฟเวอร์ออกจากแหล่งพลังงาน จากนั้นรอ 10 วินาทีแล้วจึงเริ่มระบบของเซิร์ฟเวอร์ใหม่
  1. ตรวจสอบให้แน่ใจว่า:
    • ไฟ LED แสดงข้อผิดพลาดบนแผงข้อมูลของตัวดำเนินการไม่ติดสว่าง

    • ไฟ LED แสดงข้อผิดพลาดของโมดูลหน่วยความจำบนแผงระบบไม่ติดสว่าง

    • Mirrored-Channel ของหน่วยความจำไม่อธิบายความขัดแย้ง

    • เสียบโมดูลหน่วยความจำอย่างถูกต้อง

    • คุณได้ติดตั้งหน่วยความจำประเภทที่ถูกต้อง (โปรดดู กฎ PMEM สำหรับข้อกำหนด)

    • หลังจากเปลี่ยนโมดูลหน่วยความจำ การกำหนดค่าหน่วยความจำจะถูกอัปเดตใน Setup Utility ตามไปด้วย

    • เปิดใช้แบงค์หน่วยความจำครบทุกกลุ่มแล้ว เซิร์ฟเวอร์อาจปิดใช้งานแบงค์หน่วยความจำโดยอัตโนมัติเมื่อตรวจพบปัญหา หรือมีการปิดใช้งานแบงค์หน่วยความจำด้วยตนเอง

    • ไม่พบหน่วยความจำที่ไม่ตรงกันเมื่อเซิร์ฟเวอร์กำหนดค่าหน่วยความจำขั้นต่ำ

    • หากมีการติดตั้ง PMEM:

      1. โปรดดู กฎ PMEM และดูว่าหน่วยความจำที่แสดงนั้นตรงกับคำอธิบายของโหมดหรือไม่

      2. ข้อมูลที่บันทึกไว้ทั้งหมดได้รับการสำรองข้อมูลไว้ และ Namespace ที่สร้างขึ้นจะถูกลบออกก่อนที่จะเปลี่ยนหรือเพิ่ม PMEM

      3. ไปที่ Setup Utility แล้วเลือก System Configuration and Boot Management > Intel Optane PMEMs > Security และตรวจสอบให้แน่ใจว่าปิดใช้งานการรักษาความปลอดภัยของ PMEM ทั้งหมดแล้ว

  2. ใส่โมดูลหน่วยความจำให้แน่น แล้วรีสตาร์ทเซิร์ฟเวอร์

  3. ตรวจสอบบันทึกข้อผิดพลาด POST:

    • หากโมดูลหน่วยความจำถูกปิดใช้งานโดยการรบกวนการจัดการระบบ (SMI) ให้เปลี่ยนโมดูลหน่วยความจำ

    • หากโมดูลหน่วยความจำถูกปิดใช้งานโดยผู้ใช้หรือโดย POST ให้เสียบโมดูลหน่วยความจำอีกครั้ง จากนั้นเรียกใช้ Setup Utility แล้วจึงเปิดใช้งานโมดูลหน่วยความจำ

  4. เรียกใช้การวินิจฉัยหน่วยความจำ เมื่อคุณเริ่มโซลูชันและกดปุ่มตามที่ระบุในคำแนะนำบนหน้าจอ อินเทอร์เฟซ Lenovo XClarity Provisioning Manager จะแสดงตามค่าเริ่มต้น คุณสามารถดำเนินการวินิจฉัยหน่วยความจำด้วยอินเทอร์เฟซนี้ จากหน้าการวินิจฉัย ให้ไปที่ Run Diagnostic > Memory test หรือ PMEM test

    หมายเหตุ
    เมื่อติดตั้ง PMEM แล้ว ให้เรียกใช้การวินิจฉัยตามโหมดที่ตั้งค่าอยู่ในปัจจุบัน
    • โหมด App Direct:

      • รันการทดสอบหน่วยความจำสำหรับโมดูลหน่วยความจำ DRAM

      • เรียกใช้การทดสอบ PMEM สำหรับ PMEM

  5. ย้อนกลับโมดูลระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง

  6. เปิดใช้งานโมดูลหน่วยความจำทั้งหมดอีกครั้งโดยใช้ Setup utility แล้วเริ่มระบบเซิร์ฟเวอร์ใหม่

  7. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ

  8. (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ

ตรวจพบการรวบรวมหน่วยความจำที่ไม่ถูกต้อง

หากข้อความเตือนนี้ปรากฏขึ้น ให้ทำตามขั้นตอนต่อไปนี้:
Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
  1. ดู กฎและลำดับการติดตั้งโมดูลหน่วยความจำ เพื่อให้แน่ใจว่าระบบรองรับลำดับการติดตั้งโมดูลหน่วยความจำปัจจุบัน
  2. หากแน่ใจว่าระบบรองรับลำดับปัจจุบันแล้ว ให้ดูว่าโมดูลใดแสดงเป็น “ปิดใช้งาน” ใน Setup Utility
  3. เสียบโมดูลหน่วยความจำที่แสดงเป็น “ปิดใช้งาน” ใหม่ แล้วรีบูตระบบ
  4. หากปัญหายังคงอยู่ ให้เปลี่ยนโมดูลหน่วยความจำที่แสดงเป็น “ปิดใช้งาน”

Namespace เพิ่มเติมปรากฏขึ้นมาในพื้นที่แบบ Interleave

หากมีสอง Namespace ที่สร้างขึ้นอยู่ในพื้นที่แบบ Interleave หนึ่ง VMware ESXi จะละเว้น Namespace ที่สร้างขึ้น และสร้าง Namespace เพิ่มขึ้นมาใหม่อีกหนึ่งระหว่างการบูตระบบ ให้ลบ Namespace ที่สร้างขึ้น ใน Setup Utility หรือในระบบปฏิบัติการ ก่อนการบูตครั้งแรกด้วย ESXi

ไม่รองรับการย้าย PMEM

หากข้อความเตือนนี้ปรากฏขึ้น ให้ทำตามขั้นตอนต่อไปนี้:
Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
  1. ย้ายโมดูลกลับไปยังระบบเดิมโดยมีการกำหนดค่าเหมือนกับก่อนหน้านี้
  2. สำรองข้อมูลที่จัดเก็บไว้ใน Namespace PMEM
  3. ปิดใช้งานการรักษาความปลอดภัย PMEM ด้วยตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้:
    • LXPM

      ไปที่ UEFI Setup > System Settings > Intel Optane PMEMs > Security > Press to Disable Security และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย

    • Setup Utility

      ไปที่ System Configuration and Boot Management > System Settings > Intel Optane PMEMs > Security > Press to Disable Security และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย

  4. ลบ Namespace ด้วยคำสั่งที่สอดคล้องกับระบบปฏิบัติการที่ติดตั้ง:
    • คำสั่ง Linux:

      ndctl destroy-namespace all -f

    • คำสั่ง Windows Powershell

      Get-PmemDisk | Remove-PmemDisk

  5. ล้างข้อมูลการกำหนดค่าแพลตฟอร์ม (PCD) และพื้นที่จัดเก็บป้าย Namespace (LSA) ด้วยคำสั่ง ipmctl ต่อไปนี้ (สำหรับทั้ง Linux และ Windows)

    ipmctl delete -pcd
    หมายเหตุ
    ดูลิงก์ต่อไปนี้เพื่อเรียนรู้วิธีดาวน์โหลดและใช้ impctl ในระบบปฏิบัติการต่างๆ:
  6. รีบูตระบบ แล้วกด F1 เพื่อเข้าสู่ Setup Utility
  7. ปิดเครื่องระบบ
  8. ถอดโมดูลที่จะใช้ซ้ำสำหรับระบบหรือการกำหนดค่าใหม่

มีการติดตั้ง PMEM ในช่องเสียบที่ไม่ถูกต้องหลังจากเปลี่ยนแผงระบบ

หากข้อความเตือนนี้ปรากฏขึ้น ให้ทำตามขั้นตอนต่อไปนี้:
DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
  1. บันทึกคำแนะนำในการเปลี่ยนช่องเสียบ PMEM จากเหตุการณ์ XCC
  2. ปิดเครื่องระบบและถอด PMEM ที่แสดงในข้อความแจ้งเตือน แนะนำให้ติดป้ายกำกับ PMEM เหล่านี้เพื่อไม่ให้เกิดความสับสน
  3. ติดตั้ง PMEM ในหมายเลขช่องเสียบที่ถูกต้องที่ระบุไว้ในข้อความแจ้งเตือน แกะป้ายออกเพื่อไม่ให้กีดขวางการระบายอากาศและการระบายความร้อน
  4. ทำการเปลี่ยนชิ้นส่วนให้เสร็จ แล้วเปิดเครื่อง ตรวจสอบให้แน่ใจว่าไม่มีข้อความแจ้งเตือนที่คล้ายกันใน XCC
หมายเหตุ
อย่าดำเนินการเตรียมใช้งานใดๆ บน PMEM เพื่อป้องกันไม่ให้ข้อมูลสูญหาย หากยังคงมีข้อความแจ้งเตือนอยู่ในเหตุการณ์ XCC

หลังจากที่ PMEM ได้รับการกำหนดค่าใหม่แล้ว หากข้อความแสดงข้อผิดพลาดและไฟ LED ยังคงอยู่จะเป็นการระบุว่ามีการติดตั้ง PMEM ในช่องเสียบที่ไม่ถูกต้อง

AC ระบบหรือรีสตาร์ท XCC เพื่อแก้ปัญหานี้

ไม่สามารถสร้างเป้าหมายได้สำเร็จเมื่อติดตั้ง PMEM ในระบบเป็นครั้งแรก

เมื่อเห็นข้อความต่อไปนี้:
  • ข้อผิดพลาด: ไม่สามารถเรียกข้อมูลทรัพยากรหน่วยความจำ
  • ข้อผิดพลาด: โมดูล PMEM อย่างน้อยหนึ่งโมดูลไม่มีข้อมูล PCD แนะนำให้รีบูตแพลตฟอร์มเพื่อคืนค่าข้อมูล PCD ที่ถูกต้อง
ดำเนินการตามขั้นตอนต่อไปนี้เพื่อแก้ไขปัญหา
  1. หากมีการติดตั้ง PMEM ในระบบอื่นด้วยข้อมูลที่จัดเก็บไว้ ให้ดำเนินการขั้นตอนต่อไปนี้เพื่อลบข้อมูล
    1. ตามลำดับการติดตั้งเดิม ให้ติดตั้ง PMEM ไปยังระบบเดิมที่มีการติดตั้งก่อนหน้านี้ และสำรองข้อมูลจาก PMEM ไปยังอุปกรณ์จัดเก็บข้อมูลอื่นๆ
    2. ปิดใช้งานการรักษาความปลอดภัย PMEM ด้วยตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้:
      • LXPM

        ไปที่ UEFI Setup > System Settings > Intel Optane PMEMs > Security > Press to Disable Security และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย

      • Setup Utility

        ไปที่ System Configuration and Boot Management > System Settings > Intel Optane PMEMs > Security > Press to Disable Security และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย

    3. ลบ Namespace ด้วยคำสั่งที่สอดคล้องกับระบบปฏิบัติการที่ติดตั้ง:
      • คำสั่ง Linux:

        ndctl destroy-namespace all -f

      • คำสั่ง Windows Powershell

        Get-PmemDisk | Remove-PmemDisk

    4. ล้างข้อมูลการกำหนดค่าแพลตฟอร์ม (PCD) และพื้นที่จัดเก็บป้าย Namespace (LSA) ด้วยคำสั่ง ipmctl ต่อไปนี้ (สำหรับทั้ง Linux และ Windows)

      ipmctl delete -pcd
      หมายเหตุ
      ดูลิงก์ต่อไปนี้เพื่อเรียนรู้วิธีดาวน์โหลดและใช้ impctl ในระบบปฏิบัติการต่างๆ:
  2. ติดตั้ง PMEM กลับไปยังระบบเป้าหมาย และอัปเกรดเฟิร์มแวร์ระบบเป็นเวอร์ชันล่าสุดโดยไม่ต้องเข้าสู่ Setup Utility
  3. หากปัญหายังคงอยู่ ให้เขียนทับ PMEM ด้วยคำสั่ง ndctl ดังต่อไปนี้
    ndctl sanitize-dimm --overwrite all
  4. ตรวจสอบสถานะการเขียนทับด้วยคำสั่งต่อไปนี้
    watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
  5. เมื่อเห็นการ PMEM ทั้งหมด OverwriteStatus=Completed ให้รีบูตระบบและดูว่าปัญหายังคงอยู่หรือไม่