Messaggi di timeout watchdog visualizzati per più server blade
I messaggi del timeout del controllo vengono visualizzati nel log eventi di advanced management module. Utilizzare questa procedura se questi messaggi vengono visualizzati per più server blade in uno chassis BladeCenter S.
Problema
Il log eventi di advanced management module visualizza messaggi di timeout watchdog per più server blade in uno chassis BladeCenter S.
Analisi
Per risolvere il problema, attenersi alla seguente procedura:
- Individuare degli aggiornamenti firmware per advanced management module. Esaminare la cronologia di modifiche del firmware per informazioni correlate ai suddetti errori e aggiornare il firmware se necessario.
Il firmware è disponibile nella sezione Software and device drivers - IBM BladeCenter e selezionando BladeCenter S.
- Eseguire una ricerca nella pagina di supporto IBM per individuare degli aggiornamenti firmware per advanced management module. Esaminare la cronologia di modifiche del firmware per informazioni correlate ai suddetti errori e aggiornare il firmware se necessario.
- Verificare che i livelli di codice del processore di servizio (Integrated Systems Management Processor e Baseboard Management Controller) siano aggiornati o che almeno sia stata eseguita una correzione critica su di essi.
- Verificare il funzionamento dei server blade. Se i server rispondono, il problema potrebbe essere una falsa condizione di errore.
- Verificare che il driver IBM ASR (Automatic Server Restart) sia installato sul server blade.
- Aggiornare il firmware per il processore di servizio sul server blade.
- Aggiornare il firmware per advanced management module.
- Sostituire advanced management module.
- Se nessuno dei server blade risponde e su tutti è in esecuzione lo stesso livello di sistema operativo di applicazioni simili, avviare diversi dei blade e accedere ai log del sistema operativo per ciascun server blade.
- Determinare se i blade non rispondono a causa di un problema di un modulo o di un driver software comune.
- Verificare che i driver di comunicazioni e del disco siano aggiornati.
- Sebbene non sia frequente, è possibile che vi sia sufficiente rumore sul canale di comunicazione RS-485 per consentire ai server blade di bloccare i processori di servizio. Controllare il log eventi per verificare l'eventuale presenza di numerosi errori di comunicazione del processore di servizio per tutti i server blade. In tal caso, vedere Visualizzati errori SP COMM (Service processor communication) per un server blade per ulteriori procedure di risoluzione dei problemi.
Envoyer des commentaires