ปัญหาเกี่ยวกับหน่วยความจำ
โปรดดูวิธีแก้ไขปัญหาเกี่ยวกับหน่วยความจำที่ส่วนนี้
หน่วยความจำระบบที่แสดงน้อยกว่าหน่วยความจำจริงที่ติดตั้ง
ทำขั้นตอนต่อไปนี้ให้ครบถ้วนเพื่อแก้ไขปัญหา:
- ตรวจสอบให้แน่ใจว่า:
ไฟ LED แสดงข้อผิดพลาดบนแผงข้อมูลของตัวดำเนินการไม่ติดสว่าง
ไฟ LED แสดงข้อผิดพลาดของโมดูลหน่วยความจำบนแผงระบบไม่ติดสว่าง
Mirrored-Channel ของหน่วยความจำไม่อธิบายความขัดแย้ง
เสียบโมดูลหน่วยความจำอย่างถูกต้อง
คุณได้ติดตั้งหน่วยความจำประเภทที่ถูกต้อง (โปรดดู กฎ PMEM สำหรับข้อกำหนด)
หลังจากเปลี่ยนโมดูลหน่วยความจำ การกำหนดค่าหน่วยความจำจะถูกอัปเดตใน Setup Utility ตามไปด้วย
เปิดใช้แบงค์หน่วยความจำครบทุกกลุ่มแล้ว เซิร์ฟเวอร์อาจปิดใช้งานแบงค์หน่วยความจำโดยอัตโนมัติเมื่อตรวจพบปัญหา หรือมีการปิดใช้งานแบงค์หน่วยความจำด้วยตนเอง
ไม่พบหน่วยความจำที่ไม่ตรงกันเมื่อเซิร์ฟเวอร์กำหนดค่าหน่วยความจำขั้นต่ำ
เมื่อมีการติดตั้ง PMEM:
โปรดดู กฎ PMEM และดูว่าหน่วยความจำที่แสดงนั้นตรงกับคำอธิบายของโหมดหรือไม่
หากตั้งค่าหน่วยความจำในโหมด App Direct โปรดสำรองข้อมูลที่บันทึกไว้ทั้งหมด แล้ว Namespace ที่สร้างไว้ทั้งหมดจะถูกลบก่อนที่จะเปลี่ยนหรือเพิ่ม PMEM
หากเพิ่งตั้งค่า PMEM ในโหมดหน่วยความจำ ให้กลับสู่โหมด App Direct และตรวจดูว่ามี Namespace ที่ยังไม่ได้ลบหรือไม่
ไปที่ Setup Utility แล้วเลือก
และตรวจสอบให้แน่ใจว่าปิดใช้งานการรักษาความปลอดภัยของ PMEM ทั้งหมดแล้ว
ใส่โมดูลหน่วยความจำให้แน่น แล้วรีสตาร์ทเซิร์ฟเวอร์
ตรวจสอบบันทึกข้อผิดพลาด POST:
หากโมดูลหน่วยความจำถูกปิดใช้งานโดยการรบกวนการจัดการระบบ (SMI) ให้เปลี่ยนโมดูลหน่วยความจำ
หากโมดูลหน่วยความจำถูกปิดใช้งานโดยผู้ใช้หรือโดย POST ให้เสียบโมดูลหน่วยความจำอีกครั้ง จากนั้นเรียกใช้ Setup Utility แล้วจึงเปิดใช้งานโมดูลหน่วยความจำ
เรียกใช้การวินิจฉัยหน่วยความจำ เมื่อคุณเริ่มต้นระบบเครื่องและกดปุ่มตามคำแนะนำบนหน้าจอ อินเทอร์เฟซ LXPM จะแสดงตามค่าเริ่มต้น (สำหรับข้อมูลเพิ่มเติม โปรดดูส่วน “เริ่มต้นระบบ” ในเอกสาร LXPM ที่ใช้ได้กับเซิร์ฟเวอร์ของคุณที่ หน้าพอร์ทัล Lenovo XClarity Provisioning Manager) คุณสามารถดำเนินการวินิจฉัยหน่วยความจำด้วยอินเทอร์เฟซนี้ จากหน้าการวินิจฉัย ให้ไปที่ หรือ PMEM test
หมายเหตุเมื่อติดตั้ง PMEM แล้ว ให้เรียกใช้การวินิจฉัยตามโหมดที่ตั้งค่าอยู่ในปัจจุบันโหมด App Direct:
รันการทดสอบหน่วยความจำสำหรับโมดูลหน่วยความจำ DRAM
เรียกใช้การทดสอบ PMEM สำหรับ PMEM
โหมดหน่วยความจำ:
เรียกใช้ทั้งการทดสอบหน่วยความจำและการทดสอบ PMEM สำหรับ PMEM
- ย้อนกลับโมดูลระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่องหมายเหตุเมื่อติดตั้ง PMEM แล้ว ให้ใช้วิธีนี้ในโหมดหน่วยความจำเท่านั้น
เปิดใช้งานโมดูลหน่วยความจำทั้งหมดอีกครั้งโดยใช้ Setup utility แล้วเริ่มระบบเซิร์ฟเวอร์ใหม่
(ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ
(ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ
โมดูลหน่วยความจำในช่องจำนวนหลายตัวถูกระบุว่ามีความบกพร่อง
ทำขั้นตอนต่อไปนี้ให้ครบถ้วนเพื่อแก้ไขปัญหา:
- ใส่โมดูลหน่วยความจำ แล้วรีสตาร์ทเซิร์ฟเวอร์
- ถอดโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุออก และเปลี่ยนใหม่ด้วยโมดูลหน่วยความจำที่ใช้งานได้หมายเลขเดียวกัน แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น หากความล้มเหลวยังคงอยู่หลังจากเปลี่ยนโมดูลหน่วยความจำที่ระบุทั้งหมดแล้ว ให้ไปที่ขั้นตอนที่ 4
- ใส่โมดูลหน่วยความจำที่ถอดออกมากลับไปยังขั้วต่อเดิมทีละหน่วย รีสตาร์ทเซิร์ฟเวอร์หลังจากใส่โมดูลหน่วยความจำแต่ละหน่วย จนกว่าโมดูลหน่วยความจำจะทำงานบกพร่อง เปลี่ยนโมดูลหน่วยความจำที่บกพร่องแต่ละหน่วยด้วยโมดูลหน่วยความจำที่ใช้งานได้ รีสตาร์ทเซิร์ฟเวอร์หลังจากเปลี่ยนโมดูลหน่วยความจำแต่ละครั้ง ทำซ้ำขั้นตอนที่ 3 จนกว่าคุณจะทดสอบโมดูลหน่วยความจำที่ถอดออกมาหมดทุกหน่วย
- เปลี่ยนโมดูลหน่วยความจำที่มีหมายเลขสูงสุดของกลุ่มที่ถูกระบุ แล้วรีสตาร์ทเซิร์ฟเวอร์ ทำซ้ำหากจำเป็น
- ย้อนกลับโมดูลหน่วยความจำระหว่างช่องต่างๆ (ของโปรเซสเซอร์เดียวกัน) แล้วรีสตาร์ทเซิร์ฟเวอร์ หากปัญหาเกี่ยวข้องกับโมดูลหน่วยความจำ ให้เปลี่ยนโมดูลหน่วยความจำที่บกพร่อง
- (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) ติดตั้งโมดูลหน่วยความจำที่บกพร่องลงในขั้วต่อโมดูลหน่วยความจำสำหรับโปรเซสเซอร์ 2 (หากติดตั้งไว้) เพื่อตรวจสอบว่าปัญหาไม่ได้อยู่ที่โปรเซสเซอร์หรือขั้วต่อโมดูลหน่วยความจำ
- (ช่างเทคนิคที่ได้รับการอบรมเท่านั้น) เปลี่ยนแผงระบบ
ความพยายามเปลี่ยนเป็นโหมด PMEM อื่นไม่สำเร็จ
หลังจากโหมด PMEM เปลี่ยนและระบบจะรีสตาร์ทสำเร็จแล้ว หากโหมด PMEM ยังคงเดิมอยู่แทนที่จะเปลี่ยนไป ให้ตรวจสอบจุ DRAM DIMM และความจุของ PMEM เพื่อดูว่าตรงตามเกณฑ์ของโหมดใหม่หรือไม่ (ดู กฎ PMEM)
Namespace เพิ่มเติมปรากฏขึ้นมาในพื้นที่แบบ Interleave
หากมีสอง Namespace ที่สร้างขึ้นอยู่ในพื้นที่แบบ Interleave หนึ่ง VMware ESXi จะละเว้น Namespace ที่สร้างขึ้น และสร้าง Namespace เพิ่มขึ้นมาใหม่อีกหนึ่งระหว่างการบูตระบบ ให้ลบ Namespace ที่สร้างขึ้น ใน Setup Utility หรือในระบบปฏิบัติการ ก่อนการบูทครั้งแรกด้วย ESXi
ไม่รองรับการย้าย PMEM
- Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00). These migrated PMEMs are not supported nor warranted in this system.
- ย้ายโมดูลกลับไปยังระบบเดิมโดยมีการกำหนดค่าเหมือนกับก่อนหน้านี้
- สำรองข้อมูลที่จัดเก็บไว้ใน Namespace PMEM
- ปิดใช้งานการรักษาความปลอดภัย PMEM ด้วยตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้:
Lenovo XClarity Provisioning Manager
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัยSetup Utility
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย
- ลบ Namespace ด้วยคำสั่งที่สอดคล้องกับระบบปฏิบัติการที่ติดตั้ง:
คำสั่ง Linux:
ndctl destroy-namespace all -f
คำสั่ง Windows Powershell
Get-PmemDisk | Remove-PmemDisk
ล้างข้อมูลการกำหนดค่าแพลตฟอร์ม (PCD) และพื้นที่จัดเก็บป้าย Namespace (LSA) ด้วยคำสั่ง ipmctl ต่อไปนี้ (สำหรับทั้ง Linux และ Windows)
ipmctl delete -pcd
หมายเหตุดูลิงก์ต่อไปนี้เพื่อเรียนรู้วิธีดาวน์โหลดและใช้ impctl ในระบบปฏิบัติการต่างๆ:- รีบูตระบบ และกดปุ่มตามคําแนะนําบนหน้าจอเพื่อเข้าสู่ Setup Utility (สำหรับข้อมูลเพิ่มเติม โปรดดูส่วน “เริ่มต้นระบบ” ในเอกสาร LXPM ที่ใช้ได้กับเซิร์ฟเวอร์ของคุณที่ หน้าพอร์ทัล Lenovo XClarity Provisioning Manager)
- ปิดเครื่องระบบ
- ถอดโมดูลที่จะใช้ซ้ำสำหรับระบบหรือการกำหนดค่าใหม่
ตรวจพบการรวบรวมหน่วยความจำที่ไม่ถูกต้อง
- Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
- ดู กฎและลำดับการติดตั้งโมดูลหน่วยความจำ เพื่อให้แน่ใจว่าระบบรองรับลำดับการติดตั้งโมดูลหน่วยความจำปัจจุบัน
- หากแน่ใจว่าระบบรองรับลำดับปัจจุบันแล้ว ให้ดูว่าโมดูลใดแสดงเป็น “ปิดใช้งาน” ใน Setup Utility
- เสียบโมดูลหน่วยความจำที่แสดงเป็น “ปิดใช้งาน” ใหม่ แล้วรีบูตระบบ
- หากปัญหายังคงอยู่ ให้เปลี่ยนโมดูลหน่วยความจำที่แสดงเป็น “ปิดใช้งาน”
มีการติดตั้ง PMEM ในช่องเสียบที่ไม่ถูกต้องหลังจากเปลี่ยนแผงระบบ
- DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
- บันทึกคำแนะนำในการเปลี่ยนช่องเสียบ PMEM จากเหตุการณ์ XCC
- ปิดเครื่องระบบและถอด PMEM ที่แสดงในข้อความแจ้งเตือน แนะนำให้ติดป้ายกำกับ PMEM เหล่านี้เพื่อไม่ให้เกิดความสับสน
- ติดตั้ง PMEM ในหมายเลขช่องเสียบที่ถูกต้องที่ระบุไว้ในข้อความแจ้งเตือน แกะป้ายออกเพื่อไม่ให้กีดขวางการระบายอากาศและการระบายความร้อน
- ทำการเปลี่ยนชิ้นส่วนให้เสร็จ แล้วเปิดเครื่อง ตรวจสอบให้แน่ใจว่าไม่มีข้อความแจ้งเตือนที่คล้ายกันใน XCC
หลังจากที่ PMEM ได้รับการกำหนดค่าใหม่แล้ว หากข้อความแสดงข้อผิดพลาดและไฟ LED ยังคงอยู่จะเป็นการระบุว่ามีการติดตั้ง PMEM ในช่องเสียบที่ไม่ถูกต้อง
AC ระบบหรือรีสตาร์ท XCC เพื่อแก้ปัญหานี้
ไม่สามารถสร้างเป้าหมายได้สำเร็จเมื่อติดตั้ง PMEM ในระบบเป็นครั้งแรก
- ข้อผิดพลาด: ไม่สามารถเรียกข้อมูลทรัพยากรหน่วยความจำ
- ข้อผิดพลาด: โมดูล PMEM อย่างน้อยหนึ่งโมดูลไม่มีข้อมูล PCD แนะนำให้รีบูตแพลตฟอร์มเพื่อคืนค่าข้อมูล PCD ที่ถูกต้อง
- หากมีการติดตั้ง PMEM ในระบบอื่นด้วยข้อมูลที่จัดเก็บไว้ ให้ดำเนินการขั้นตอนต่อไปนี้เพื่อลบข้อมูล
- ตามลำดับการติดตั้งเดิม ให้ติดตั้ง PMEM ไปยังระบบเดิมที่มีการติดตั้งก่อนหน้านี้ และสำรองข้อมูลจาก PMEM ไปยังอุปกรณ์จัดเก็บข้อมูลอื่นๆ
- ปิดใช้งานการรักษาความปลอดภัย PMEM ด้วยตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้:
Lenovo XClarity Provisioning Manager
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัยSetup Utility
ไปที่
และป้อนวลีรหัสผ่านเพื่อปิดใช้งานการรักษาความปลอดภัย
- ลบ Namespace ด้วยคำสั่งที่สอดคล้องกับระบบปฏิบัติการที่ติดตั้ง:
คำสั่ง Linux:
ndctl destroy-namespace all -f
คำสั่ง Windows Powershell
Get-PmemDisk | Remove-PmemDisk
ล้างข้อมูลการกำหนดค่าแพลตฟอร์ม (PCD) และพื้นที่จัดเก็บป้าย Namespace (LSA) ด้วยคำสั่ง ipmctl ต่อไปนี้ (สำหรับทั้ง Linux และ Windows)
ipmctl delete -pcd
หมายเหตุดูลิงก์ต่อไปนี้เพื่อเรียนรู้วิธีดาวน์โหลดและใช้ impctl ในระบบปฏิบัติการต่างๆ:
- ติดตั้ง PMEM กลับไปยังระบบเป้าหมาย และอัปเกรดเฟิร์มแวร์ระบบเป็นเวอร์ชันล่าสุดโดยไม่ต้องเข้าสู่ Setup Utility
หากปัญหายังคงอยู่ ให้เขียนทับ PMEM ด้วยคำสั่ง ndctl ดังต่อไปนี้
ndctl sanitize-dimm --overwrite all
ตรวจสอบสถานะการเขียนทับด้วยคำสั่งต่อไปนี้
watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
- เมื่อเห็นการ PMEM ทั้งหมด OverwriteStatus=Completed ให้รีบูตระบบและดูว่าปัญหายังคงอยู่หรือไม่