目視で確認できる問題
目視で確認できる問題を解決するには、この情報を使用します。
UEFI ブート・プロセス中にサーバーがハングアップする
UEFI ブート・プロセス中に UEFI: DXE INIT というメッセージがディスプレイに表示されシステムがハングアップする場合は、オプション ROM が「レガシー」の設定を使用して構成されていないことを確認してください。Lenovo XClarity Essentials OneCLI を使用して次のコマンドを実行することで、オプション ROM の現在の設定をリモート側から表示できます。
onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress
レガシー・オプション ROM 設定を使用したブート・プロセス中に停止したシステムをリカバリーするには、以下の技術ヒントを参照してください。
オプション ROM の設定がレガシー用に構成されている場合、ThinkSystem サーバーは UEFI ブート中にハングアップして「UEFI:DXE INIT」と表示される
レガシー・オプション ROM を使用する必要がある場合は、「デバイスおよび I/O ポート」メニューでスロット・オプション ROM を「レガシー」に設定しないでください。代わりに、スロット・オプション ROM を「自動」 (デフォルト設定) に設定し、システム・ブート・モードを「レガシー・モード」に設定します。レガシー・オプション ROM はシステムがブートする直前に起動されます。
サーバーをオンにすると、すぐに POST イベント・ビューアーが表示される
システム LED と診断ディスプレイによって示されているエラーがあればすべて訂正します。
サーバーがすべてのプロセッサーをサポートし、プロセッサーの速度とキャッシュ・サイズが相互に一致していることを確認します。
システム・セットアップからプロセッサーの詳細を表示できます。
プロセッサーがサーバーでサポートされているかどうかを判別するには、Lenovo ServerProven Web サイト を参照してください。
(トレーニングを受けた技術員のみ) プロセッサー 1 が正しく取り付けられていることを確認します。
(トレーニングを受けた技術員のみ) プロセッサー 2 を取り外して、サーバーを再起動します。
次のコンポーネントを、リストに示されている順序で一度に 1 つずつ交換し、そのたびにサーバーを再起動します。
(トレーニングを受けた技術員のみ) プロセッサー
(トレーニングを受けた技術員のみ) システム・ボード
サーバーが応答しない (POST が完了し、オペレーティング・システムが稼働している)
サーバーの設置場所にいる場合は、以下のステップを実行してください。
KVM 接続を使用している場合、その接続が正常に機能していることを確認します。使用していない場合は、キーボードおよびマウスが正常に機能していることを確認します。
可能な場合、サーバーにログインし、すべてのアプリケーションが稼働している (ハングしているアプリケーションがない) ことを確認します。
サーバーを再起動します。
問題が解決しない場合は、すべての新規ソフトウェアが正しくインストールおよび構成されていることを確認します。
ソフトウェアの購入先またはソフトウェア・プロバイダーに連絡します。
リモート・ロケーションからサーバーにアクセスしている場合は、以下のステップを実行してください。
すべてのアプリケーションが稼働している (ハングしているアプリケーションがない) ことを確認します。
システムからログアウトしてから、再度ログインしてみます。
コマンド・ラインからサーバーに対して ping または traceroute を実行してネットワーク・アクセスを検証します。
ping テスト中に応答が得られない場合は、シャーシ内の別のサーバーに ping を試行し、接続の問題であるのか、サーバーの問題であるのかを判別します。
trace route を実行し、接続が切断されている場所を判別します。VPN あるいは接続が切断されているポイントの接続の問題の解決を試行します。
管理インターフェースからサーバーをリモートで再起動します。
問題が解決しない場合は、すべての新規ソフトウェアが正しくインストールおよび構成されていることを確認します。
ソフトウェアの購入先またはソフトウェア・プロバイダーに連絡します。
サーバーが応答しない (POST が失敗し、システム・セットアップを起動できない)
デバイスの追加やアダプターのファームウェア更新などの構成変更、およびファームウェアまたはアプリケーションのコードの問題により、サーバーの POST (電源オン・セルフテスト) が失敗することがあります。
サーバーは自動的に再起動し、POST を再試行します。
サーバーは停止し、ユーザーはサーバーの POST を再試行するために、サーバーを手動で再起動する必要があります。
新たに追加したデバイスを取り外し、システムをデフォルトのハードウェア構成に戻します。
システムを再起動し、システム・セットアップを正常にブートできるかどうか確認します。
- できない場合は以下を実行します。
プロセッサー・ボードを交換します。
システム I/O ボードを交換します。
できる場合は、障害が疑われるデバイスを別のテスト対象システム (SUT) に移動してみてください。
SUT システムが正常に機能する場合、問題はプロセッサー・ボードまたはシステム I/O ボードによって発生している可能性があります。
SUT システムが正常に機能しない場合、障害が疑われるデバイスに問題がある可能性があります。
障害が疑われる部品をすべて分離しても、問題が変わらない場合、影響を受けるシステムを最小構成で実行して問題をさらに細かく分離し、1 つずつ部品を戻していってください。
電圧プレーナー障害がイベント・ログに表示される
システムを最小構成に戻します。最低限必要なプロセッサーと DIMM の数については、仕様を参照してください。
システムを再起動します。
システムが再起動する場合は、取り外した部品を一度に 1 つずつ追加して、そのたびにシステムを再起動し、これをエラーが発生するまで繰り返します。エラーが発生した部品を交換します。
システムが再起動しない場合は、まずプロセッサー・ボード、次にシステム I/O ボードが原因の可能性があります。
サーバーが高温になっているように見える
問題が解決するまで、以下のステップを実行します。
複数のサーバーまたはシャーシ:
- 室温が指定の範囲内であることを確認します (仕様を参照)。
ファンが正しく取り付けられていることを確認します。
UEFI および XCC を最新のバージョンに更新します。
サーバーのフィラーが正しく取り付けられていることを確認します (詳細な取り付け手順については、ハードウェア交換手順を参照)。
IPMI コマンドを使用して、ファン速度をフルスピードに上げ、問題を解決できるかどうかを確認します。
注IPMI raw コマンドは、トレーニングを受けた技術員のみが使用してください。各システムには固有の PMI raw コマンドがあります。- 管理プロセッサーのイベント・ログで、温度上昇イベントがないかを確認します。イベントがない場合、サーバーは正常な作動温度内で稼働しています。ある程度の温度変化は予想されるので注意してください。
新しいアダプターを取り付けた後、レガシー・モードに入ることができない
以下の手順に従って、問題を修正します。
- の順に選択します。
- 操作システムが取り付けられている RAID アダプターをリストの先頭に移動します。
- 「保存」を選択します。
- システムをリブートして、オペレーティング・システムを自動ブートします。
部品またはシャーシが破損している
Lenovo サポートに連絡してください。