Passa al contenuto principale

Messaggi di timeout watchdog visualizzati per un server blade

I messaggi del timeout del controllo vengono visualizzati nel log eventi di advanced management module. Utilizzare questa procedura in presenza di più server blade in uno chassis BladeCenter S e qualora venissero visualizzati questi messaggi per uno solo dei server blade.

Problema

Il log eventi di advanced management module visualizza messaggi di timeout watchdog per uno solo dei server blade in uno chassis BladeCenter S.

Analisi

Per risolvere il problema, attenersi alla seguente procedura:
  1. Individuare degli aggiornamenti firmware per il server blade e il processore di servizio. Esaminare la cronologia di modifiche del firmware per informazioni correlate ai suddetti errori e aggiornare il firmware se necessario.

    Il firmware è disponibile nella sezione Sofware and device drivers - IBM BladeCenter selezionando il server blade installato. Viene generalmente riportato in Advanced Systems Management.

  2. Individuare degli aggiornamenti firmware per advanced management module. Esaminare la cronologia di modifiche del firmware per informazioni correlate ai suddetti errori e aggiornare il firmware se necessario.
  3. Verificare il funzionamento del server blade. Se tale server risponde, il problema potrebbe essere una falsa condizione di errore.
    1. Verificare che il driver IBM ASR (Automatic Server Restart) sia installato sul server blade.
    2. Aggiornare il firmware per il processore di servizio sul server blade.
  4. Se il server blade non risponde, determinare la causa del problema:
    • In presenza di messaggi di timeout watchdog POST per questo server blade nel log eventi, l'immagine flash del BIOS sul server blade potrebbe essere danneggiata.
      1. Se nel server blade è installata una scheda di espansione I/O, rimuoverla e riavviare il server.
        • Se il server blade si avvia correttamente, sostituire la scheda di espansione I/O.
        • Se il server blade continua a non rispondere, forzarne l'avvio dall'immagine flash di backup. Sarà necessario rimuovere il server blade dallo chassis BladeCenter S, aprire il coperchio e spostare uno dei ponticelli. Per informazioni su questa procedura, consultare la documentazione fornita con il server blade.
          • Se il server blade viene avviato dall'immagine flash di backup, aggiornare il firmware per tale server.
          • Se il server blade continua a non rispondere, sostituirlo.
    • In presenza di messaggi di timeout watchdog SO per questo server blade nel log eventi, accedere ai log del sistema operativo per determinare perché il server blade non risponde.
      • Determinare se la mancata capacità di risposta è dovuta ad un problema del modulo o del driver software.
      • Ricercare i controlli della macchina o gli errori di memoria nel log eventi.
      • Verificare che i driver di comunicazioni e del disco siano aggiornati.
  5. Ricercare nel log eventi altri errori correlati all'hardware, ad esempio errori CPU o DIMM. Se vengono visualizzati dei malfunzionamenti hardware prima che si verifichi il timeout watchdog, il problema potrebbe essere relativo ad uno dei componenti hardware del server blade. Seguire le consuete procedure di debug per isolare il componente hardware malfunzionante e sostituirlo.
    Nota
    Unità disco fisso, schede I/O e moduli di espansione I/O potrebbero causare malfunzionamenti CPU a causa di errori del bus.