メインコンテンツまでスキップ

ウォッチドッグ・タイムアウト・メッセージが 1 台のブレード・サーバーに対して表示される

ウォッチドッグ・タイムアウト・メッセージは、拡張管理モジュールのイベント・ログに表示されます。BladeCenter S シャーシに複数のブレード・サーバーがあり、そのうち 1 台のブレード・サーバーに対してのみこれらのメッセージが表示される場合は、この手順を使用してください。

問題

拡張管理モジュールのイベント・ログに、BladeCenter S シャーシの 1 台のみのブレード・サーバーに対するウォッチドッグ・タイムアウト・メッセージが表示される。

検証

この問題を解決するには、以下のステップを実行します。
  1. ブレード・サーバーとサービス・プロセッサーのファームウェア更新を検索します。ウォッチドッグ・タイムアウト・エラーに関連した情報についてファームウェア変更ヒストリーを確認し、必要に応じてファームウェアを更新します。

    ファームウェアを検索するには、Sofware and device drivers - IBM BladeCenter にアクセスし、設置されているブレード・サーバーを選択します。これは、通常、「Advanced Systems Management」下に表示されます。

  2. 拡張管理モジュールのファームウェア更新を検索します。ウォッチドッグ・タイムアウト・エラーに関連した情報についてファームウェア変更ヒストリーを確認し、必要に応じてファームウェアを更新します。
  3. ブレード・サーバーのオペレーションを確認します。これが反応する場合は、偽のエラー状態が問題である可能性があります。
    1. ブレード・サーバーに IBM Automatic Server Restart (ASR) ドライバーがインストールされていることを確認します。
    2. ブレード・サーバーのサービス・プロセッサーのファームウェアを更新します。
  4. ブレード・サーバーが反応しない場合は、次のように問題の原因を判別します。
    • イベント・ログにこのブレード・サーバーに対する POST ウォッチドッグ・タイムアウト・メッセージがある場合は、ブレード・サーバーの BIOS フラッシュ・イメージが破損している可能性があります。
      1. I/O 拡張カードがブレード・サーバーに取り付けられている場合は、これを取り外してブレード・サーバーをリブートします。
        • ブレード・サーバーが正常にブートする場合は、I/O 拡張カードを交換します。
        • これでもブレード・サーバーが反応しない場合は、強制的にブレード・サーバーがバックアップ・フラッシュ・イメージからブートするようにします。ブレード・サーバーを BladeCenter S シャーシから取り外し、カバーを開いてジャンパーのいずれか 1 つを移動する必要があります。この手順については、ブレード・サーバーに付属の資料を参照してください。
          • ブレード・サーバーがバックアップ・フラッシュ・イメージからブートする場合は、ブレード・サーバーのファームウェアを更新します。
          • これでもブレード・サーバーが反応しない場合は、そのブレード・サーバーを交換します。
    • イベント・ログにこのブレード・サーバーに対する OS ウォッチドッグ・タイムアウト・メッセージがある場合は、オペレーティング・システム・ログを表示してブレード・サーバーが反応しない原因を判別します。
      • 反応しない原因がソフトウェア・ドライバーまたはモジュールの問題によるものなのかを判別します。
      • イベント・ログでマシン・チェックまたはメモリー・エラーがないか確認します。
      • ディスクおよび通信ドライバーが最新であることを確認します。
  5. イベント・ログで CPU エラーや DIMM エラーなどの他のハードウェア関連エラーがないか確認します。ウォッチドッグ・タイムアウトが発生する前にハードウェア障害が発生した場合は、ブレード・サーバーのハードウェア・コンポーネントのいずれかに問題がある可能性があります。通常のデバッグ手順を実行して障害のあるハードウェア・コンポーネントを分離し、そのコンポーネントを交換します。
    ハード・ディスク、I/O カード、および I/O 拡張モジュールは、バス・エラーによる CPU 障害の原因となる場合があります。