ปัญหาเกี่ยวกับหน่วยความจำ
โปรดดูวิธีแก้ไขปัญหาเกี่ยวกับหน่วยความจำที่ส่วนนี้
ปัญหาทั่วไปเกี่ยวกับหน่วยความจำ
ปัญหาเกี่ยวกับ PMEM โดยเฉพาะ
โมดูลหน่วยความจำหลายโมดูลถูกระบุว่ามีความบกพร่องหรือปิดใช้งานอยู่
ทำขั้นตอนต่อไปนี้ให้ครบถ้วนเพื่อแก้ไขปัญหา
- ตรวจสอบบันทึก XCC เพื่อดูว่าโมดูลที่ปิดใช้งานตัวใดตัวหนึ่งบกพร่องหรือไม่ หากเป็นเช่นนั้น ให้เปลี่ยนโมดูลที่บกพร่องและเริ่มระบบเพื่อดูว่าโมดูลทั้งหมดได้รับการตรวจพบอย่างถูกต้องหรือไม่หมายเหตุเมื่อหน่วยความจำหนึ่งโมดูลทำงานบกพร่อง ระบบจะดำเนินการดาวน์เกรดหน่วยความจำเป็นรูปแบบที่รองรับที่ใกล้เคียงที่สุด ในขณะที่โมดูลหน่วยความจำที่ติดตั้งบางตัวจะไม่ถูกตรวจพบโดยระบบ
- ใส่โมดูลหน่วยความจำ แล้วรีสตาร์ทเซิร์ฟเวอร์
- ถอดโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุออก และเปลี่ยนใหม่ด้วยโมดูลหน่วยความจำที่ใช้งานได้หมายเลขเดียวกัน แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น หากความล้มเหลวยังคงอยู่หลังจากเปลี่ยนโมดูลหน่วยความจำที่ระบุทั้งหมดแล้ว ให้ไปที่ขั้นตอนที่ 4
- ใส่โมดูลหน่วยความจำที่ถอดออกมากลับไปยังขั้วต่อเดิมทีละหน่วย รีสตาร์ทเซิร์ฟเวอร์หลังจากใส่โมดูลหน่วยความจำแต่ละหน่วย จนกว่าโมดูลหน่วยความจำจะทำงานบกพร่อง เปลี่ยนโมดูลหน่วยความจำที่บกพร่องแต่ละหน่วยด้วยโมดูลหน่วยความจำที่ใช้งานได้ รีสตาร์ทเซิร์ฟเวอร์หลังจากเปลี่ยนโมดูลหน่วยความจำแต่ละครั้ง ทำซ้ำขั้นตอนที่ 3 จนกว่าคุณจะทดสอบโมดูลหน่วยความจำที่ถอดออกมาหมดทุกหน่วย
- เปลี่ยนโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุ แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น
- ย้อนกลับโมดูลหน่วยความจำระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง
- (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ
- (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ
หน่วยความจำระบบที่แสดงน้อยกว่าหน่วยความจำจริงที่ติดตั้ง
ทำขั้นตอนต่อไปนี้ให้ครบถ้วนเพื่อแก้ไขปัญหา
- ตรวจสอบให้แน่ใจว่า:
ไฟ LED แสดงข้อผิดพลาดบนแผงข้อมูลของตัวดำเนินการไม่ติดสว่าง
ไฟ LED แสดงข้อผิดพลาดของโมดูลหน่วยความจำบนแผงระบบไม่ติดสว่าง
Mirrored-Channel ของหน่วยความจำไม่อธิบายความขัดแย้ง
เสียบโมดูลหน่วยความจำอย่างถูกต้อง
คุณได้ติดตั้งหน่วยความจำประเภทที่ถูกต้อง (โปรดดู กฎ PMEM สำหรับข้อกำหนด)
หลังจากเปลี่ยนโมดูลหน่วยความจำ การกำหนดค่าหน่วยความจำจะถูกอัปเดตใน Setup Utility ตามไปด้วย
เปิดใช้แบงค์หน่วยความจำครบทุกกลุ่มแล้ว เซิร์ฟเวอร์อาจปิดใช้งานแบงค์หน่วยความจำโดยอัตโนมัติเมื่อตรวจพบปัญหา หรือมีการปิดใช้งานแบงค์หน่วยความจำด้วยตนเอง
ไม่พบหน่วยความจำที่ไม่ตรงกันเมื่อเซิร์ฟเวอร์กำหนดค่าหน่วยความจำขั้นต่ำ
หากมีการติดตั้ง PMEM:
โปรดดู กฎ PMEM และดูว่าหน่วยความจำที่แสดงนั้นตรงกับคำอธิบายของโหมดหรือไม่
ข้อมูลที่บันทึกไว้ทั้งหมดได้รับการสำรองข้อมูลไว้ และ Namespace ที่สร้างขึ้นจะถูกลบออกก่อนที่จะเปลี่ยนหรือเพิ่ม PMEM
ไปที่ Setup Utility แล้วเลือก
และตรวจสอบให้แน่ใจว่าปิดใช้งานการรักษาความปลอดภัยของ PMEM ทั้งหมดแล้ว
ใส่โมดูลหน่วยความจำให้แน่น แล้วรีสตาร์ทเซิร์ฟเวอร์
ตรวจสอบบันทึกข้อผิดพลาด POST:
หากโมดูลหน่วยความจำถูกปิดใช้งานโดยการรบกวนการจัดการระบบ (SMI) ให้เปลี่ยนโมดูลหน่วยความจำ
หากโมดูลหน่วยความจำถูกปิดใช้งานโดยผู้ใช้หรือโดย POST ให้เสียบโมดูลหน่วยความจำอีกครั้ง จากนั้นเรียกใช้ Setup Utility แล้วจึงเปิดใช้งานโมดูลหน่วยความจำ
เรียกใช้การวินิจฉัยหน่วยความจำ เมื่อคุณเริ่มโซลูชันและกดปุ่มตามที่ระบุในคำแนะนำบนหน้าจอ อินเทอร์เฟซ Lenovo XClarity Provisioning Manager จะแสดงตามค่าเริ่มต้น คุณสามารถดำเนินการวินิจฉัยหน่วยความจำด้วยอินเทอร์เฟซนี้ จากหน้าการวินิจฉัย ให้ไปที่ หรือ PMEM test
หมายเหตุเมื่อติดตั้ง PMEM แล้ว ให้เรียกใช้การวินิจฉัยตามโหมดที่ตั้งค่าอยู่ในปัจจุบันโหมด App Direct:
รันการทดสอบหน่วยความจำสำหรับโมดูลหน่วยความจำ DRAM
เรียกใช้การทดสอบ PMEM สำหรับ PMEM
ย้อนกลับโมดูลระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง
เปิดใช้งานโมดูลหน่วยความจำทั้งหมดอีกครั้งโดยใช้ Setup utility แล้วเริ่มระบบเซิร์ฟเวอร์ใหม่
(ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ
(ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ
ตรวจพบการรวบรวมหน่วยความจำที่ไม่ถูกต้อง
Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
- ดู กฎและลำดับการติดตั้งโมดูลหน่วยความจำ เพื่อให้แน่ใจว่าระบบรองรับลำดับการติดตั้งโมดูลหน่วยความจำปัจจุบัน
- หากแน่ใจว่าระบบรองรับลำดับปัจจุบันแล้ว ให้ดูว่าโมดูลใดแสดงเป็น “ปิดใช้งาน” ใน Setup Utility
- เสียบโมดูลหน่วยความจำที่แสดงเป็น “ปิดใช้งาน” ใหม่ แล้วรีบูตระบบ
- หากปัญหายังคงอยู่ ให้เปลี่ยนโมดูลหน่วยความจำที่แสดงเป็น “ปิดใช้งาน”
Namespace เพิ่มเติมปรากฏขึ้นมาในพื้นที่แบบ Interleave
หากมีสอง Namespace ที่สร้างขึ้นอยู่ในพื้นที่แบบ Interleave หนึ่ง VMware ESXi จะละเว้น Namespace ที่สร้างขึ้น และสร้าง Namespace เพิ่มขึ้นมาใหม่อีกหนึ่งระหว่างการบูตระบบ ให้ลบ Namespace ที่สร้างขึ้น ใน Setup Utility หรือในระบบปฏิบัติการ ก่อนการบูตครั้งแรกด้วย ESXi
ไม่รองรับการย้าย PMEM
Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
- ย้ายโมดูลกลับไปยังระบบเดิมโดยมีการกำหนดค่าเหมือนกับก่อนหน้านี้
- สำรองข้อมูลที่จัดเก็บไว้ใน Namespace PMEM
- ปิดใช้งานการรักษาความปลอดภัย PMEM ด้วยตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้:
LXPM
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัยSetup Utility
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย
- ลบ Namespace ด้วยคำสั่งที่สอดคล้องกับระบบปฏิบัติการที่ติดตั้ง:
คำสั่ง Linux:
ndctl destroy-namespace all -f
คำสั่ง Windows Powershell
Get-PmemDisk | Remove-PmemDisk
- ล้างข้อมูลการกำหนดค่าแพลตฟอร์ม (PCD) และพื้นที่จัดเก็บป้าย Namespace (LSA) ด้วยคำสั่ง ipmctl ต่อไปนี้ (สำหรับทั้ง Linux และ Windows)
ipmctl delete -pcd
หมายเหตุดูลิงก์ต่อไปนี้เพื่อเรียนรู้วิธีดาวน์โหลดและใช้ impctl ในระบบปฏิบัติการต่างๆ: - รีบูตระบบ แล้วกด F1 เพื่อเข้าสู่ Setup Utility
- ปิดเครื่องระบบ
- ถอดโมดูลที่จะใช้ซ้ำสำหรับระบบหรือการกำหนดค่าใหม่
มีการติดตั้ง PMEM ในช่องเสียบที่ไม่ถูกต้องหลังจากเปลี่ยนแผงระบบ
DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
- บันทึกคำแนะนำในการเปลี่ยนช่องเสียบ PMEM จากเหตุการณ์ XCC
- ปิดเครื่องระบบและถอด PMEM ที่แสดงในข้อความแจ้งเตือน แนะนำให้ติดป้ายกำกับ PMEM เหล่านี้เพื่อไม่ให้เกิดความสับสน
- ติดตั้ง PMEM ในหมายเลขช่องเสียบที่ถูกต้องที่ระบุไว้ในข้อความแจ้งเตือน แกะป้ายออกเพื่อไม่ให้กีดขวางการระบายอากาศและการระบายความร้อน
- ทำการเปลี่ยนชิ้นส่วนให้เสร็จ แล้วเปิดเครื่อง ตรวจสอบให้แน่ใจว่าไม่มีข้อความแจ้งเตือนที่คล้ายกันใน XCC
หลังจากที่ PMEM ได้รับการกำหนดค่าใหม่แล้ว หากข้อความแสดงข้อผิดพลาดและไฟ LED ยังคงอยู่จะเป็นการระบุว่ามีการติดตั้ง PMEM ในช่องเสียบที่ไม่ถูกต้อง
AC ระบบหรือรีสตาร์ท XCC เพื่อแก้ปัญหานี้
ไม่สามารถสร้างเป้าหมายได้สำเร็จเมื่อติดตั้ง PMEM ในระบบเป็นครั้งแรก
- ข้อผิดพลาด: ไม่สามารถเรียกข้อมูลทรัพยากรหน่วยความจำ
- ข้อผิดพลาด: โมดูล PMEM อย่างน้อยหนึ่งโมดูลไม่มีข้อมูล PCD แนะนำให้รีบูตแพลตฟอร์มเพื่อคืนค่าข้อมูล PCD ที่ถูกต้อง
- หากมีการติดตั้ง PMEM ในระบบอื่นด้วยข้อมูลที่จัดเก็บไว้ ให้ดำเนินการขั้นตอนต่อไปนี้เพื่อลบข้อมูล
- ตามลำดับการติดตั้งเดิม ให้ติดตั้ง PMEM ไปยังระบบเดิมที่มีการติดตั้งก่อนหน้านี้ และสำรองข้อมูลจาก PMEM ไปยังอุปกรณ์จัดเก็บข้อมูลอื่นๆ
- ปิดใช้งานการรักษาความปลอดภัย PMEM ด้วยตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้:
LXPM
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัยSetup Utility
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย
- ลบ Namespace ด้วยคำสั่งที่สอดคล้องกับระบบปฏิบัติการที่ติดตั้ง:
คำสั่ง Linux:
ndctl destroy-namespace all -f
คำสั่ง Windows Powershell
Get-PmemDisk | Remove-PmemDisk
- ล้างข้อมูลการกำหนดค่าแพลตฟอร์ม (PCD) และพื้นที่จัดเก็บป้าย Namespace (LSA) ด้วยคำสั่ง ipmctl ต่อไปนี้ (สำหรับทั้ง Linux และ Windows)
ipmctl delete -pcd
หมายเหตุดูลิงก์ต่อไปนี้เพื่อเรียนรู้วิธีดาวน์โหลดและใช้ impctl ในระบบปฏิบัติการต่างๆ:
- ติดตั้ง PMEM กลับไปยังระบบเป้าหมาย และอัปเกรดเฟิร์มแวร์ระบบเป็นเวอร์ชันล่าสุดโดยไม่ต้องเข้าสู่ Setup Utility
- หากปัญหายังคงอยู่ ให้เขียนทับ PMEM ด้วยคำสั่ง ndctl ดังต่อไปนี้
ndctl sanitize-dimm --overwrite all
- ตรวจสอบสถานะการเขียนทับด้วยคำสั่งต่อไปนี้
watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
- เมื่อเห็นการ PMEM ทั้งหมด OverwriteStatus=Completed ให้รีบูตระบบและดูว่าปัญหายังคงอยู่หรือไม่