メインコンテンツまでスキップ

システム・レベル診断の実行

コントローラーを交換するときは必ず、特定のコンポーネントおよびサブシステムに対して包括的なテストまたは重点的なテストを実行する必要があります。

このタスクについて

診断手順のすべてのコマンドは、コンポーネントを交換するコントローラーから発行されます。

  1. 保守を受けるコントローラーが LOADER プロンプトになっていない場合、halt と入力してコントローラーを再起動します。

    コマンドを発行したら、システムが LOADER プロンプトで止まるまで待つ必要があります。

  2. LOADER プロンプトで、システム・レベル診断が正しく機能するために特別に設計された特殊なドライバーにアクセスします (boot_diags)。
    ブート・プロセス中、保守モード・プロンプト (*>) が表示されるまではプロンプトに安全に y で応答できます。
  3. コントローラー・モジュール上の使用可能なデバイスを表示して書き留めます (sldiag device show -dev mb)。

    表示されるコントローラー・モジュール・デバイスとポートは、次のうち 1 つ以上になります。

    • bootmedia はシステム起動デバイスです。
    • cna は、ネットワークまたはストレージ・デバイスに接続されていないコンバージド・ネットワーク・アダプターまたはインターフェースです。
    • fcal は、Fibre Channel ネットワークに接続されていない Fibre Channel-Arbitrated Loop デバイスです。
    • env はマザーボードの環境です。
    • mem はシステム・メモリーです。
    • nic は、ネットワーク・インターフェース・カードです。
    • nvram は不揮発性 RAM です。
    • nvmem は NVRAM とシステム・メモリーのハイブリッドです。
    • sas はディスク・シェルフに接続されていない、Serial Attached SCSI デバイスです。
  4. 保守メニューから各コンポーネントの診断を実行します。例: sldiag device status -dev nvmem -long -state failed
    診断テストを実行する場所操作
    個々のコンポーネント
    1. ステータス・ログをクリアします (sldiag device clearstatus)。
    2. 選択したデバイスの使用可能なテストを表示します (sldiag device show -devdev_name)。

      dev_name は、前述の手順で識別されたポートとデバイスのいずれかです。

    3. 出力を確認し、該当する場合は、実行するテストのみ選択します (sldiag device modify -devdev_name -selection only)。

      -selection only では、デバイスで実行しない他のすべてのテストが無効になります。

    4. 選択したテストを実行します (sldiag device run -dev dev_name )。

      テストが完了したら、以下のメッセージが表示されます。
      *> <SLDIAG:_ALL_TESTS_COMPLETED>

    5. 失敗したテストがないことを確認します (sldiag device status -dev dev_name -long -state failed)。

      テストの失敗がない場合は、システム・レベル診断がプロンプトに戻ります。それ以外の場合、コンポーネントのテストの結果得られた障害のフル・ステータスがリストされます。

    同時に複数のコンポーネント
    1. 前の手順の出力で有効なデバイスと無効なデバイスを確認し、どのデバイスを同時に実行するかを決定します。
    2. デバイスの個々のテストをリストします (sldiag device show -dev dev_name )。
    3. 出力を確認し、該当する場合は、実行するテストのみ選択します (sldiag device modify -devdev_name -selection only)。

      -selection only では、デバイスで実行しない他のすべてのテストが無効になります。

    4. テストが変更されたことを確認します (sldiag device show)。
    5. 同時に実行するデバイスごとに、これらのサブステップを繰り返します。
    6. すべてのデバイスで診断を実行します (sldiag device run)。
      重要
      診断の実行を開始した後に、エントリーを追加または変更しないでください。
      テストが完了したら、以下のメッセージが表示されます。
      *> <SLDIAG:_ALL_TESTS_COMPLETED>

    7. コントローラーにハードウェアの問題がないことを確認します (sldiag device status -long -state failed)。

      テストの失敗がない場合は、システム・レベル診断がプロンプトに戻ります。それ以外の場合、コンポーネントのテストの結果得られた障害のフル・ステータスがリストされます。

  5. 前の手順の結果に基づいて進みます。
    システム・レベル診断テストの結果操作
    エラーなしで完了した
    1. ステータス・ログをクリアします (sldiag device clearstatus)。
    2. ログがクリアされたことを確認します (sldiag device status)。

      以下のデフォルトの応答が表示されます。

      SLDIAG: No log messages are present.

    3. halt と入力して保守モードを終了します。

      システムに LOADER プロンプトが表示されます。

    4. boot_ontap と入力し、コントローラーを通常動作に戻します。

    いくつかのテストが失敗した問題の原因を特定します。
    1. 保守モードを終了します (halt)。
    2. クリーン・シャットダウンを実行した後、パワー・サプライを取り外します。
    3. システム・レベル診断を実行するために識別されたすべての考慮事項に従っていること、ケーブルがしっかり接続されていること、ハードウェア・コンポーネントがストレージ・システムに適切に取り付けられていることを確認します。
    4. パワー・サプライを再接続し、ストレージ・システムの電源をオンにします。
    5. システム・レベル診断テストを再実行します。