Zum Hauptinhalt springen

Speicherfehler

In diesem Abschnitt erfahren Sie, wie Sie Speicherprobleme beheben können.

Mehrere Speichermodule in einem Kanal werden als fehlerhaft erkannt

Anmerkung
Bei jedem Installieren oder Entfernen eines Speichermoduls müssen Sie die Stromversorgung des Servers unterbrechen. Warten Sie dann 10 Sekunden, bevor Sie den Server erneut starten.

Gehen Sie wie folgt vor, um das Problem zu beheben.

  1. Überprüfen Sie, ob die Speichermodule richtig eingesetzt sind. Starten Sie den Server dann erneut.
  2. Entfernen Sie von den erkannten Speichermodulen das Speichermodul mit der höchsten Nummer und ersetzen Sie es durch ein identisches und funktionierendes Speichermodul. Starten Sie anschließend den Server neu. Wiederholen Sie den Vorgang ggf. Wenn die Fehler nach dem Austausch aller identifizierten Speichermodule weiterhin auftreten, fahren Sie mit Schritt 4 fort.
  3. Setzen Sie die entfernten Speichermodule einzeln nacheinander wieder in die ursprünglichen Steckplätze ein. Starten Sie den Server dann nach jedem Speichermodul erneut, bis Sie das fehlerhafte Speichermodul bestimmen können. Ersetzen Sie jedes fehlerhafte Speichermodul durch ein identisches, funktionsfähiges Speichermodul. Starten Sie den Server dann nach jedem Speichermodulaustausch erneut. Wiederholen Sie Schritt 3, bis Sie alle entfernten Speichermodule überprüft haben.
  4. Ersetzen Sie von den identifizierten Speichermodulen das mit der höchsten Nummer und starten Sie dann den Server neu. Wiederholen Sie den Vorgang ggf.
  5. Vertauschen Sie die Speichermodule zwischen den Kanälen (desselben Prozessors), und starten Sie dann den Server erneut. Wenn der Fehler in Beziehung zu einem Speichermodul steht, ersetzen Sie das fehlerhafte Speichermodul.
  6. (Nur für qualifizierte Kundendiensttechniker) Installieren Sie das fehlerhafte Speichermodul in einem Speichermodul-Steckplatz für Prozessor 2 (sofern installiert), um sicherzustellen, dass weder der Prozessor noch der Speichermodul-Steckplatz die Fehlerursache sind.
  7. (Nur für qualifizierte Kundendiensttechniker) Tauschen Sie die Systemplatine aus.

Angezeigter Systemspeicher liegt unterhalb des installierten physischen Speichers

Gehen Sie wie folgt vor, um das Problem zu beheben.

Anmerkung
Bei jedem Installieren oder Entfernen eines Speichermoduls müssen Sie die Stromversorgung des Servers unterbrechen. Warten Sie dann 10 Sekunden, bevor Sie den Server erneut starten.
  1. Stellen Sie Folgendes sicher:
    • Auf der Bedienerinformationsanzeige leuchten keine Fehleranzeigen.

    • Auf der Systemplatine leuchten keine Fehleranzeigen für Speichermodule.

    • Die Abweichung wird nicht durch Speicherkanalspiegelung verursacht.

    • Die Speichermodule sind ordnungsgemäß eingesetzt.

    • Sie haben den richtigen Speichermodultyp installiert (Anforderungen siehe PMEM-Regeln).

    • Nach Änderung oder Austausch eines Speichermoduls wird die Speicherkonfiguration im Setup Utility entsprechend aktualisiert.

    • Alle Speichergruppen sind aktiviert. Möglicherweise wurde eine Speichergruppe vom Server beim Auftreten eines Fehlers automatisch deaktiviert, oder eine Speichergruppe wurde manuell deaktiviert.

    • Es gibt keine Speicherabweichung, wenn für den Server die minimale Speicherkonfiguration verwendet wird.

    • Wenn PMEMs installiert sind:

      1. Wenn der Speicher auf den App Direct-Modus festgelegt wurde, sind alle gespeicherten Daten gesichert worden und erstellte Namespaces wurden gelöscht, bevor ein PMEM ersetzt oder hinzugefügt wird.

      2. Lesen Sie den Abschnitt PMEM-Regeln und überprüfen Sie, ob der angezeigte Speicher der Beschreibung des Modus entspricht.

      3. Wenn vor Kurzem PMEMs im Speichermodus festgelegt wurden, wechseln Sie zurück in den App Direct-Modus und überprüfen Sie, ob ein Namespace vorhanden ist, der nicht gelöscht wurde.

      4. Wechseln Sie zum Setup Utility, wählen Sie Systemkonfiguration und Bootmanagement > Intel Optane PMEMs > Sicherheit aus und stellen Sie sicher, dass die Sicherheit aller PMEM-Einheiten deaktiviert ist.

  2. Überprüfen Sie, ob die Speichermodule richtig eingesetzt sind, und starten Sie den Server dann erneut.

  3. Überprüfen Sie das POST-Fehlerprotokoll auf folgende Punkte hin:

    • Wenn ein Speichermodul durch ein SMI (System Management Interrupt) deaktiviert wurde, ersetzen Sie das Speichermodul.

    • Wenn ein Speichermodul von einem Benutzer oder beim POST deaktiviert wurde, überprüfen Sie, ob das Speichermodul richtig eingesetzt ist. Anschließend führen Sie das Setup Utility aus und aktivieren das Speichermodul.

  4. Führen Sie die Speicherdiagnoseprogramme aus. Wenn Sie eine Lösung starten und die Taste gemäß den Anweisungen auf dem Bildschirm drücken, wird standardmäßig die LXPM-Schnittstelle angezeigt. (Weitere Informationen finden Sie im Abschnitt „Start“ in der LXPM Dokumentation für Ihren Server unter Portalseite für Lenovo XClarity Provisioning Manager.) Sie können die Speicherdiagnoseprogramme über diese Schnittstelle ausführen. Wechseln Sie von der Diagnoseseite zu Diagnose ausführen > Speichertest oder PMEM-Test.

    Anmerkung
    Wenn PMEMs installiert sind, führen Sie die Diagnose basierend auf dem Modus aus, der derzeit konfiguriert ist:
    • App Direct-Modus:

      • Führen Sie den Speichertest für DRAM-Speichermodule aus.

      • Führen Sie den PMEM-Test für PMEMs aus.

    • Speichermodus:

      Führen Sie sowohl den Speichertest als auch den PMEM-Test für PMEMs aus.

  5. Vertauschen Sie die Module zwischen den Kanälen (desselben Prozessors), und starten Sie dann den Server erneut. Wenn der Fehler in Beziehung zu einem Speichermodul steht, ersetzen Sie das fehlerhafte Speichermodul.
    Anmerkung
    Wenn PMEMs installiert sind, übernehmen Sie diese Methode nur im Speichermodus.
  6. Aktivieren Sie alle Speichermodule wieder mit dem Setup Utility und starten Sie dann den Server neu.

  7. (Nur für qualifizierte Kundendiensttechniker) Installieren Sie das fehlerhafte Speichermodul in einem Speichermodul-Steckplatz für Prozessor 2 (sofern installiert), um sicherzustellen, dass weder der Prozessor noch der Speichermodul-Steckplatz die Fehlerursache sind.

  8. (Nur für qualifizierte Kundendiensttechniker) Tauschen Sie die Systemplatine aus.

Es wurde eine ungültige Speicherbestückung erkannt

Gehen Sie wie folgt vor, wenn diese Warnung angezeigt wird:
  • Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
  1. Lesen Sie für die Anforderungen den Abschnitt Installationsregeln und ‑reihenfolge für Speichermodule, um sicherzustellen, dass die vorliegende Speichermodul-Bestückungsreihenfolge unterstützt wird.
  2. Wenn die vorliegende Sequenz in der Tat unterstützt wird, überprüfen Sie, ob eines der Module in Setup Utility als "deaktiviert" angezeigt wird.
  3. Setzen Sie das Modul, das als "deaktiviert" angezeigt wird, erneut ein und starten Sie das System neu.
  4. Wenn das Problem weiterhin besteht, tauschen Sie das Speichermodul aus.

Beim Versuch, in einen anderen PMEM-Modus zu wechseln, tritt ein Fehler auf

Nachdem der PMEM-Modus geändert und das System erfolgreich neu gestartet wurde und wenn der PMEM-Modus identisch ist und nicht geändert wurde, überprüfen Sie die Kapazität der DRAM-DIMMs und des PMEM, um festzustellen, ob sie der Anforderung des neuen Modus entspricht (Anforderungen siehe PMEM-Regeln).

Ein zusätzlicher Namespace wird in einer überlappten Region angezeigt.

Wenn zwei erstellte Namespaces in einer überlappten Region vorhanden sind, ignoriert VMware ESXi die erstellten Namespaces und erstellt beim Booten des Systems einen zusätzlichen neuen Namespace. Löschen Sie die erstellten Namespaces entweder im Setup Utility oder im Betriebssystem, bevor der erste Start mit ESXi durchgeführt wird.

Migrierte PMEMs werden nicht unterstützt

Gehen Sie wie folgt vor, wenn diese Warnung angezeigt wird:
  • Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
  1. Versetzen Sie die Module zum ursprünglichen System und behalten Sie die vorherige Konfiguration exakt bei.
  2. Sichern Sie gespeicherte Daten in PMEM-Namespaces.
  3. Deaktivieren Sie die PMEM-Sicherheit mit einer der folgenden Optionen:
    • LXPM

      Navigieren Sie zu UEFI-Konfiguration > Systemeinstellungen > Intel Optane PMEMs > Sicherheit > Klicken, um Sicherheit zu deaktivieren und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.

    • Setup Utility

      Navigieren Sie zu Systemkonfiguration und Bootmanagement > Systemeinstellungen > Intel Optane PMEMs > Sicherheit > Klicken, um Sicherheit zu deaktivieren und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.

  4. Löschen Sie Namespaces mit dem Befehl, der dem installierten Betriebssystem entspricht:
    • Linux Befehl:

      ndctl destroy-namespace all -f

    • Windows Powershell-Befehl

      Get-PmemDisk | Remove-PmemDisk

  5. Löschen Sie die Plattformkonfigurationsdaten (PCD) und den Namespace-Etikettenspeicherbereich (LSA) mit dem folgenden ipmctl-Befehl (für Linux und Windows).

    ipmctl delete -pcd

    Anmerkung
    Informationen zum Herunterladen und Verwenden von impctl in verschiedenen Betriebssystemen erhalten Sie über die folgenden Links:
  6. Starten Sie das System neu, und drücken Sie die Taste gemäß den Anweisungen auf dem Bildschirm, um das Setup Utility-Programm zu öffnen. (Weitere Informationen finden Sie im Abschnitt „Start“ in der LXPM Dokumentation für Ihren Server unter Portalseite für Lenovo XClarity Provisioning Manager.)
  7. Schalten Sie das System aus.
  8. Entfernen Sie die Module, die für ein neues System oder eine neue Konfiguration wiederverwendet werden sollen.

PMEMs nach Austausch der Systemplatine in falschen Steckplätzen installiert

Gehen Sie wie folgt vor, wenn diese Warnung angezeigt wird:
  • DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
  1. Notieren Sie sich die Anweisungen zum Ändern des PMEM-Steckplatzes aus den XCC-Ereignissen.
  2. Schalten Sie das System aus und entfernen Sie die PMEMs, die in den Warnmeldungen erwähnt werden. Es wird empfohlen, diese PMEMs zu kennzeichnen, um Verwechslungen zu vermeiden.
  3. Installieren Sie die PMEMs in der richtigen Steckplatznummer, die in den Warnmeldungen angegeben ist. Entfernen Sie die Etiketten, um eine Blockierung des Luftstroms und der Kühlung zu vermeiden.
  4. Schließen Sie den Austausch ab und schalten Sie das System ein. Vergewissern Sie sich, dass in XCC keine ähnlichen Warnmeldungen vorhanden sind.
Anmerkung
Führen Sie keine Bereitstellung auf dem PMEM aus, solange die Nachrichten in XCC-Ereignissen noch angezeigt werden, um einen Datenverlust zu vermeiden.

Nach der Neukonfiguration von PMEMs zeigen Fehlermeldungen und Anzeigen weiterhin an, wenn PMEMs in falschen Steckplätzen installiert sind.

Trennen Sie das System vom Wechselstrom und schließen Sie es wieder an oder starten Sie XCC neu, um dieses Problem zu beheben.

Ziel kann nicht erfolgreich erstellt werden, wenn PMEMs zum ersten Mal im System installiert werden

Wenn Sie eine der folgenden Nachrichten sehen:
  • FEHLER: Informationen zu Speicherressourcen können nicht abgerufen werden
  • FEHLER: Ein oder mehrere PMEM-Module haben keine PCD-Daten. Es wird ein Neustart der Plattform empfohlen, um gültige PCD-Daten wiederherzustellen.
Gehen Sie wie folgt vor, um das Problem zu beheben.
  1. Wenn die PMEMs in einem anderen System mit gespeicherten Daten installiert wurden, gehen Sie wie folgt vor, um die Daten zu löschen.
    1. Installieren Sie die PMEMs entsprechend ihrer ursprünglichen Bestückungsreihenfolge im Ursprungssystem, in dem sie zuvor installiert waren, und sichern Sie die Daten der PMEMs auf anderen Speichereinheiten.
    2. Deaktivieren Sie die PMEM-Sicherheit mit einer der folgenden Optionen:
      • LXPM

        Navigieren Sie zu UEFI-Konfiguration > Systemeinstellungen > Intel Optane PMEMs > Sicherheit > Klicken, um Sicherheit zu deaktivieren und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.

      • Setup Utility

        Navigieren Sie zu Systemkonfiguration und Bootmanagement > Systemeinstellungen > Intel Optane PMEMs > Sicherheit > Klicken, um Sicherheit zu deaktivieren und geben Sie die Passphrase ein, um die Sicherheit zu deaktivieren.

    3. Löschen Sie Namespaces mit dem Befehl, der dem installierten Betriebssystem entspricht:
      • Linux Befehl:

        ndctl destroy-namespace all -f

      • Windows Powershell-Befehl

        Get-PmemDisk | Remove-PmemDisk

    4. Löschen Sie die Plattformkonfigurationsdaten (PCD) und den Namespace-Etikettenspeicherbereich (LSA) mit dem folgenden ipmctl-Befehl (für Linux und Windows).

      ipmctl delete -pcd

      Anmerkung
      Informationen zum Herunterladen und Verwenden von impctl in verschiedenen Betriebssystemen erhalten Sie über die folgenden Links:
  2. Installieren Sie die PMEMs wieder im Zielsystem und aktualisieren Sie die Systemfirmware auf die aktuelle Version, ohne das Setup Utility-Programm zu starten.
  3. Wenn das Problem weiterhin besteht, überschreiben Sie die PMEMs mit dem folgenden ndctl-Befehl.

    ndctl sanitize-dimm --overwrite all

  4. Überwachen Sie den Überschreibungsstatus mit dem folgenden Befehl.

    watch -n 1 “ipmctl show -d OverwriteStatus -dimm”

  5. Wenn als Status für alle PMEMs OverwriteStatus=Completed angezeigt wird, starten Sie das System neu und prüfen Sie, ob das Problem weiterhin besteht.