Speicherfehler
In diesem Abschnitt erfahren Sie, wie Sie Speicherprobleme beheben können.
Häufig auftretende Speicherfehler
PMEM-spezifische Probleme
Mehrere Speichermodule in einem Kanal werden als fehlerhaft oder deaktiviert erkannt
Gehen Sie wie folgt vor, um das Problem zu beheben.
- Überprüfen Sie das XCC-Protokoll, um zu festzustellen, ob eines der deaktivierten Module fehlerhaft ist. Wenn dies so ist, ersetzen Sie das fehlerhafte Modul und starten Sie das System, um zu prüfen, ob alle Module ordnungsgemäß erkannt werden.AnmerkungWenn ein Speichermodul nicht funktioniert, führt das System eine Herabstufung des Speichers auf die nächste unterstützte Kombination aus. Dabei werden einige installierte Speichermodule vom System nicht erkannt.
- Überprüfen Sie, ob die Speichermodule richtig eingesetzt sind. Starten Sie den Server dann erneut.
- Entfernen Sie von den erkannten Speichermodulen das Speichermodul mit der höchsten Nummer und ersetzen Sie es durch ein identisches und funktionierendes Speichermodul. Starten Sie anschließend den Server neu. Wiederholen Sie den Vorgang ggf. Wenn die Fehler nach dem Austausch aller identifizierten Speichermodule weiterhin auftreten, fahren Sie mit Schritt 4 fort.
- Setzen Sie die entfernten Speichermodule einzeln nacheinander wieder in die ursprünglichen Steckplätze ein. Starten Sie den Server dann nach jedem Speichermodul erneut, bis Sie das fehlerhafte Speichermodul bestimmen können. Ersetzen Sie jedes fehlerhafte Speichermodul durch ein identisches, funktionsfähiges Speichermodul. Starten Sie den Server dann nach jedem Speichermodulaustausch erneut. Wiederholen Sie Schritt 3, bis Sie alle entfernten Speichermodule überprüft haben.
- Ersetzen Sie von den identifizierten Speichermodulen das mit der höchsten Nummer und starten Sie dann den Server neu. Wiederholen Sie den Vorgang ggf.
- Vertauschen Sie die Speichermodule zwischen den Kanälen (desselben Prozessors), und starten Sie dann den Server erneut. Wenn der Fehler in Beziehung zu einem Speichermodul steht, ersetzen Sie das fehlerhafte Speichermodul.
- (Nur für qualifizierte Kundendiensttechniker) Installieren Sie das fehlerhafte Speichermodul in einem Speichermodul-Steckplatz für Prozessor 2 (sofern installiert), um sicherzustellen, dass weder der Prozessor noch der Speichermodul-Steckplatz die Fehlerursache sind.
- (Nur für qualifizierte Kundendiensttechniker) Ersetzen Sie die Systemplatine.
Angezeigter Systemspeicher liegt unterhalb des installierten physischen Speichers
Gehen Sie wie folgt vor, um das Problem zu beheben.
- Stellen Sie Folgendes sicher:
Auf der Bedienerinformationsanzeige leuchten keine Fehleranzeigen.
Auf der Systemplatine leuchten keine Fehleranzeigen für Speichermodule.
Die Abweichung wird nicht durch Speicherkanalspiegelung verursacht.
Die Speichermodule sind ordnungsgemäß eingesetzt.
Es wurde der richtige Speichermodultyp installiert (Anforderungen siehe PMEM-Regeln).
Nach Änderung oder Austausch eines Speichermoduls wird die Speicherkonfiguration im Setup Utility entsprechend aktualisiert.
Alle Speichergruppen sind aktiviert. Möglicherweise wurde eine Speichergruppe vom Server beim Auftreten eines Fehlers automatisch deaktiviert, oder eine Speichergruppe wurde manuell deaktiviert.
Es gibt keine Speicherabweichung, wenn für den Server die minimale Speicherkonfiguration verwendet wird.
Wenn PMEMs installiert sind:
Lesen Sie den Abschnitt PMEM-Regeln und überprüfen Sie, ob der angezeigte Speicher der Beschreibung des Modus entspricht.
Alle gespeicherten Daten wurden gesichert und erstellte Namespaces werden gelöscht, bevor ein PMEM ersetzt oder hinzugefügt wird.
Wechseln Sie zum Setup Utility, wählen Sie
aus und stellen Sie sicher, dass die Sicherheit aller PMEM-Einheiten deaktiviert ist.
Überprüfen Sie, ob die Speichermodule richtig eingesetzt sind, und starten Sie den Server dann erneut.
Überprüfen Sie das POST-Fehlerprotokoll auf folgende Punkte hin:
Wenn ein Speichermodul durch ein SMI (System Management Interrupt) deaktiviert wurde, ersetzen Sie das Speichermodul.
Wenn ein Speichermodul von einem Benutzer oder beim POST inaktiviert wurde, überprüfen Sie, ob das Speichermodul richtig eingesetzt ist. Führen Sie anschließend das Konfigurationsdienstprogramm aus, und aktivieren Sie das Speichermodul.
Führen Sie die Speicherdiagnoseprogramme aus. Wenn Sie eine Lösung starten und die in den Anweisungen auf dem Bildschirm angegebene Taste drücken, wird standardmäßig die Schnittstelle Lenovo XClarity Provisioning Manager angezeigt. Sie können die Speicherdiagnoseprogramme über diese Schnittstelle ausführen. Wechseln Sie von der Diagnoseseite zu oder PMEM-Test.
AnmerkungWenn PMEMs installiert sind, führen Sie die Diagnose basierend auf dem Modus aus, der derzeit konfiguriert ist:App Direct-Modus:
Führen Sie den Speichertest für DRAM-Speichermodule aus.
Führen Sie den PMEM-Test für PMEMs aus.
Vertauschen Sie die Module zwischen den Kanälen (desselben Prozessors), und starten Sie dann den Server erneut. Wenn der Fehler in Beziehung zu einem Speichermodul steht, ersetzen Sie das fehlerhafte Speichermodul.
Aktivieren Sie alle Speichermodule wieder mit dem Setup Utility und starten Sie dann den Server neu.
(Nur für qualifizierte Kundendiensttechniker) Installieren Sie das fehlerhafte Speichermodul in einem Speichermodul-Steckplatz für Prozessor 2 (sofern installiert), um sicherzustellen, dass weder der Prozessor noch der Speichermodul-Steckplatz die Fehlerursache sind.
(Nur für qualifizierte Kundendiensttechniker) Ersetzen Sie die Systemplatine.
Es wurde eine ungültige Speicherbestückung erkannt
Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
- Lesen Sie die Installationsregeln und ‑reihenfolge für Speichermodule, um sicherzustellen, dass die vorliegende Speichermodul-Belegungsreihenfolge unterstützt wird.
- Wenn die vorliegende Sequenz in der Tat unterstützt wird, überprüfen Sie, ob eines der Module in Setup Utility als "deaktiviert" angezeigt wird.
- Setzen Sie das Modul, das als "deaktiviert" angezeigt wird, erneut ein und starten Sie das System neu.
- Wenn das Problem weiterhin besteht, ersetzen Sie das Speichermodul, das als „deaktiviert“ angezeigt wird.
Ein zusätzlicher Namespace wird in einer überlappten Region angezeigt.
Wenn zwei erstellte Namespaces in einer überlappten Region vorhanden sind, ignoriert VMware ESXi die erstellten Namespaces und erstellt beim Booten des Systems einen zusätzlichen neuen Namespace. Löschen Sie die erstellten Namespaces entweder im Setup Utility oder im Betriebssystem, bevor der erste Start mit ESXi durchgeführt wird.
Migrierte PMEMs werden nicht unterstützt
Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
- Versetzen Sie die Module zum ursprünglichen System und behalten Sie die vorherige Konfiguration exakt bei.
- Sichern Sie gespeicherte Daten in PMEM-Namespaces.
- Deaktivieren Sie die PMEM-Sicherheit mit einer der folgenden Optionen:
LXPM
Navigieren Sie zu
und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.Setup Utility
Navigieren Sie zu
und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.
- Löschen Sie Namespaces mit dem Befehl, der dem installierten Betriebssystem entspricht:
Linux Befehl:
ndctl destroy-namespace all -f
Windows Powershell-Befehl
Get-PmemDisk | Remove-PmemDisk
- Löschen Sie die Plattformkonfigurationsdaten (PCD) und den Namespace-Etikettenspeicherbereich (LSA) mit dem folgenden ipmctl-Befehl (für Linux und Windows).
ipmctl delete -pcd
AnmerkungInformationen zum Herunterladen und Verwenden von impctl in verschiedenen Betriebssystemen erhalten Sie über die folgenden Links: - Starten Sie das System neu und drücken Sie die Taste F1, um das Setup Utility-Programm zu öffnen.
- Schalten Sie das System aus.
- Entfernen Sie die Module, die für ein neues System oder eine neue Konfiguration wiederverwendet werden sollen.
PMEMs nach Austausch der Systemplatine in falschen Steckplätzen installiert
DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
- Notieren Sie sich die Anweisungen zum Ändern des PMEM-Steckplatzes aus den XCC-Ereignissen.
- Schalten Sie das System aus und entfernen Sie die PMEMs, die in den Warnmeldungen erwähnt werden. Es wird empfohlen, diese PMEMs zu kennzeichnen, um Verwechslungen zu vermeiden.
- Installieren Sie die PMEMs in der richtigen Steckplatznummer, die in den Warnmeldungen angegeben ist. Entfernen Sie die Etiketten, um eine Blockierung des Luftstroms und der Kühlung zu vermeiden.
- Schließen Sie den Austausch ab und schalten Sie das System ein. Vergewissern Sie sich, dass in XCC keine ähnlichen Warnmeldungen vorhanden sind.
Nach der Neukonfiguration von PMEMs zeigen Fehlermeldungen und Anzeigen weiterhin an, wenn PMEMs in falschen Steckplätzen installiert sind.
Trennen Sie das System vom Wechselstrom und schließen Sie es wieder an oder starten Sie XCC neu, um dieses Problem zu beheben.
Ziel kann nicht erfolgreich erstellt werden, wenn PMEMs zum ersten Mal im System installiert werden
- FEHLER: Informationen zu Speicherressourcen können nicht abgerufen werden
- FEHLER: Ein oder mehrere PMEM-Module haben keine PCD-Daten. Es wird ein Neustart der Plattform empfohlen, um gültige PCD-Daten wiederherzustellen.
- Wenn die PMEMs in einem anderen System mit gespeicherten Daten installiert wurden, gehen Sie wie folgt vor, um die Daten zu löschen.
- Installieren Sie die PMEMs entsprechend ihrer ursprünglichen Bestückungsreihenfolge im Ursprungssystem, in dem sie zuvor installiert waren, und sichern Sie die Daten der PMEMs auf anderen Speichereinheiten.
- Deaktivieren Sie die PMEM-Sicherheit mit einer der folgenden Optionen:
LXPM
Navigieren Sie zu
und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.Setup Utility
Navigieren Sie zu
und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.
- Löschen Sie Namespaces mit dem Befehl, der dem installierten Betriebssystem entspricht:
Linux Befehl:
ndctl destroy-namespace all -f
Windows Powershell-Befehl
Get-PmemDisk | Remove-PmemDisk
- Löschen Sie die Plattformkonfigurationsdaten (PCD) und den Namespace-Etikettenspeicherbereich (LSA) mit dem folgenden ipmctl-Befehl (für Linux und Windows).
ipmctl delete -pcd
AnmerkungInformationen zum Herunterladen und Verwenden von impctl in verschiedenen Betriebssystemen erhalten Sie über die folgenden Links:
- Installieren Sie die PMEMs wieder im Zielsystem und aktualisieren Sie die Systemfirmware auf die aktuelle Version, ohne das Setup Utility-Programm zu starten.
- Wenn das Problem weiterhin besteht, überschreiben Sie die PMEMs mit dem folgenden ndctl-Befehl.
ndctl sanitize-dimm --overwrite all
- Überwachen Sie den Überschreibungsstatus mit dem folgenden Befehl.
watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
- Wenn als Status für alle PMEMs OverwriteStatus=Completed angezeigt wird, starten Sie das System neu und prüfen Sie, ob das Problem weiterhin besteht.