Problemi relativi alla memoria
Consultare questa sezione per risolvere i problemi relativi alla memoria.
Problemi comuni relativi alla memoria
Problemi specifici dei moduli PMEM
Più moduli di memoria identificato come guasto o disabilitato
Completare la seguente procedura per risolvere il problema.
- Controllare il log di XCC per verificare se uno dei moduli disabilitati non funziona correttamente. In questo caso, sostituire il modulo malfunzionante e avviare il sistema per verificare se tutti i moduli vengono riconosciuti correttamente.NotaQuando un modulo di memoria non funziona correttamente, il sistema esegue il downgrade di memoria alla prima combinazione supportata, mentre alcuni moduli di memoria installati non vengono riconosciuti dal sistema.
- Riposizionare i moduli di memoria e riavviare il server.
- Rimuovere il modulo di memoria con la numerazione più alta tra quelli identificati e sostituirlo con un modulo di memoria identico che funziona correttamente; quindi riavviare il server. Ripetere l'operazione secondo necessità. Se i malfunzionamenti continuano dopo che tutti i moduli di memoria sono stati sostituiti, andare al passaggio 4.
- Riposizionare i moduli di memoria rimossi, uno per volta, nei rispettivi connettori originali, riavviando il server dopo ogni modulo di memoria, finché non si verifica il malfunzionamento di un modulo di memoria. Sostituire ogni modulo di memoria guasto con un modulo di memoria identico che funziona correttamente, riavviando il server dopo ogni sostituzione del modulo di memoria. Ripetere il passaggio 3 finché non saranno stati testati tutti i moduli di memoria rimossi.
- Sostituire il modulo di memoria con la numerazione più alta tra quelli identificati, quindi riavviare il server. Ripetere l'operazione secondo necessità.
- Invertire i moduli di memoria tra i canali (dello stesso processore), quindi riavviare il server. Se il problema è correlato a un modulo di memoria, sostituire il modulo di memoria guasto.
- (Solo per tecnici qualificati) Installare il modulo di memoria malfunzionante in un connettore del modulo di memoria per il processore 2 (se installato) per verificare che il problema non sia il processore o il connettore del modulo di memoria.
- (Solo per tecnici qualificati) Sostituire la scheda di sistema.
La memoria di sistema visualizzata è inferiore alla memoria fisica installata
Completare la seguente procedura per risolvere il problema.
- Assicurarsi che:
Nessun LED di errore è acceso sul pannello informativo dell'operatore.
Nessun LED di errore del modulo di memoria è acceso sulla scheda di sistema.
Il canale sottoposto a mirroring della discrepanza non tenga conto della discrepanza.
I moduli di memoria siano installati correttamente.
Sia stato installato il tipo corretto di modulo di memoria (vedere Regole PMEM per i requisiti).
Dopo avere cambiato o sostituito un modulo di memoria, la configurazione della memoria venga aggiornata di conseguenza in Setup Utility.
Tutti i banchi di memoria siano abilitati. Il server potrebbe avere disabilitato automaticamente un banco di memoria al momento del rilevamento di un problema o un banco di memoria potrebbe essere stato disabilitato manualmente.
Non vi sia alcuna mancata corrispondenza di memoria quando il server è alla configurazione di memoria minima.
Se sono installati i moduli PMEM:
Vedere Regole PMEM e verificare se la memoria visualizzata corrisponde alla descrizione della modalità.
Viene eseguito il backup di tutti i dati salvati e gli spazi dei nomi creati vengono eliminati prima che qualsiasi modulo PMEM venga sostituito o aggiunto.
Accedere a Setup Utility, selezionare
e verificare che la protezione di tutte le unità PMEM sia disabilitata.
Riposizionare i moduli di memoria e quindi riavviare il server.
Controllare il log errori del POST:
Se un modulo di memoria è stato disattivato da un SMI (System-Management Interrupt), sostituirlo.
Se un modulo di memoria è stato disabilitato dall'utente o dal POST, riposizionare il modulo di memoria, quindi eseguire Setup Utility e abilitare il modulo di memoria.
Eseguire la diagnostica della memoria. Quando si avvia una soluzione e si preme il tasto specificato nelle istruzioni visualizzate, l'interfaccia di Lenovo XClarity Provisioning Manager viene visualizzata per impostazione predefinita. Con questa interfaccia è possibile eseguire la diagnostica della memoria. Dalla pagina Diagnostica, selezionare o Test PMEM.
NotaQuando sono installati i moduli PMEM, eseguire la diagnostica in base alla modalità attualmente impostata:Modalità App Diretta:
Eseguire il test di memoria per i moduli di memoria DRAM.
Eseguire il test PMEM per i moduli PMEM.
Invertire i moduli tra i canali (dello stesso processore), quindi riavviare il server. Se il problema è correlato a un modulo di memoria, sostituire il modulo di memoria guasto.
Riabilitare tutti i moduli di memoria utilizzando Setup Utilty e riavviare il server.
(Solo per tecnici qualificati) Installare il modulo di memoria malfunzionante in un connettore del modulo di memoria per il processore 2 (se installato) per verificare che il problema non sia il processore o il connettore del modulo di memoria.
(Solo per tecnici qualificati) Sostituire la scheda di sistema.
Popolamento di memoria non valido rilevato
Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
- Vedere Regole e ordine di installazione dei moduli di memoria per verificare che la presente sequenza di popolamento dei moduli di memoria sia supportata.
- Se la presente sequenza è supportata, verificare se uno dei moduli viene visualizzato come "disabilitato" in Setup Utility.
- Riposizionare il modulo visualizzato come "disabilitato" e riavviare il sistema.
- Se il problema persiste, sostituire il modulo di memoria visualizzato come "disabilitato".
Viene visualizzato uno spazio dei nomi aggiuntivo in un'area interlacciata
Se sono presenti due spazi dei nomi creati in un'area interfoliata, VMware ESXi ignora gli spazi dei nomi creati e crea un nuovo spazio dei nomi aggiuntivo durante l'avvio del sistema. Eliminare gli spazi dei nomi creati in Setup Utility o nel sistema operativo prima dell'avvio iniziale con ESXi.
I moduli PMEM migrati non sono supportati
Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
- Spostare i moduli nel sistema originale con la stessa configurazione precedente.
- Eseguire il backup dei dati memorizzati negli spazi dei nomi PMEM.
- Disabilitare la protezione PMEM con una delle seguenti opzioni:
LXPM
Accedere a
e immettere la passphrase per disabilitare la protezione.Setup Utility
Accedere a
e immettere la passphrase per disabilitare la protezione.
- Eliminare gli spazi dei nomi con il comando corrispondente al sistema operativo installato:
Comando Linux:
ndctl destroy-namespace all -f
Comando Windows Powershell
Get-PmemDisk | Remove-PmemDisk
- Cancellare i dati PCD (Platform Configuration Data) e NLSA (Namespace Label Storage Area) con il seguente comando ipmctl (sia per Linux sia per Windows).
ipmctl delete -pcd
NotaVisitare i seguenti collegamenti per informazioni su come scaricare e utilizzare impctl in diversi sistemi operativi: - Riavviare il sistema e premere F1 per accedere a Setup Utility.
- Spegnere il sistema.
- Rimuovere i moduli da riutilizzare per un nuovo sistema o configurazione.
Moduli PMEM installati in slot errati dopo la sostituzione della scheda di sistema
DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
- Registrare le istruzioni di modifica dello slot PMEM dagli eventi XCC.
- Spegnere il sistema e rimuovere i moduli PMEM riportati nei messaggi di avvertenza. Si consiglia di etichettare questi moduli PMEM per evitare confusione.
- Installare i moduli PMEM nel numero di slot corretto indicato nei messaggi di avvertenza. Rimuovere le etichette per evitare il blocco del flusso d'aria e del raffreddamento.
- Completare la sostituzione e accendere il sistema. Assicurarsi che non vi siano messaggi di avvertenza simili in XCC.
Dopo aver riconfigurato i moduli PMEM, i messaggi di errore e i LED persistono per indicare che i moduli PMEM sono installati in slot errati
Eseguire un ciclo CA del sistema o riavviare XCC per risolvere questo problema.
Non è possibile creare correttamente l'obiettivo durante la prima installazione dei moduli PMEM nel sistema
- ERRORE: impossibile recuperare le informazioni sulle risorse della memoria
- ERRORE: uno o più moduli PMEM non dispongono di dati PCD. Si consiglia un riavvio della piattaforma per ripristinare i dati PCD validi.
- Se i moduli PMEM sono stati installati in un altro sistema con dati archiviati, completare i passaggi seguenti per cancellare i dati.
- In base all'ordine di popolazione originale, installare i moduli PMEM nel sistema originale in cui erano installati in precedenza e eseguire il backup dei dati dei moduli PMEM in altri dispositivi di storage.
- Disabilitare la protezione PMEM con una delle seguenti opzioni:
LXPM
Accedere a
e immettere la passphrase per disabilitare la protezione.Setup Utility
Accedere a
e immettere la passphrase per disabilitare la protezione.
- Eliminare gli spazi dei nomi con il comando corrispondente al sistema operativo installato:
Comando Linux:
ndctl destroy-namespace all -f
Comando Windows Powershell
Get-PmemDisk | Remove-PmemDisk
- Cancellare i dati PCD (Platform Configuration Data) e NLSA (Namespace Label Storage Area) con il seguente comando ipmctl (sia per Linux sia per Windows).
ipmctl delete -pcd
NotaVisitare i seguenti collegamenti per informazioni su come scaricare e utilizzare impctl in diversi sistemi operativi:
- Reinstallare i moduli PMEM nel sistema di destinazione e aggiornare il firmware di sistema alla versione più recente senza immettere accedere a Setup Utility.
- Se il problema persiste, sovrascrivere i moduli PMEM con il seguente comando ndctl.
ndctl sanitize-dimm --overwrite all
- Monitorare lo stato della sovrascrittura con il comando seguente.
watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
- Quando viene visualizzato il messaggio PMEM OverwriteStatus=Completed, riavviare il sistema e verificare se il problema persiste.