目視で確認できる問題
目視で確認できる問題を解決するには、この情報を使用します。
UEFI ブート・プロセス中にサーバーがハングアップする
UEFI ブート・プロセス中に UEFI: DXE INIT というメッセージがディスプレイに表示されシステムがハングアップする場合は、オプション ROM が「レガシー」の設定を使用して構成されていないことを確認してください。Lenovo XClarity Essentials OneCLI を使用して次のコマンドを実行することで、オプション ROM の現在の設定をリモート側から表示できます。
onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress
レガシー・オプション ROM 設定を使用したブート・プロセス中に停止したシステムをリカバリーするには、以下の技術ヒントを参照してください。
オプション ROM をレガシーに設定すると、「UEFI:DXE INIT」を使用した UEFI ブート時に ThinkSystem サーバーがハングする
レガシー・オプション ROM を使用する必要がある場合は、「デバイスおよび I/O ポート」メニューでスロット・オプション ROM を「レガシー」に設定しないでください。代わりに、スロット・オプション ROM を「自動」 (デフォルト設定) に設定し、システム・ブート・モードを「レガシー・モード」に設定します。レガシー・オプション ROM はシステムがブートする直前に起動されます。
サーバーをオンにすると、すぐに POST イベント・ビューアーが表示される
システム LED と診断ディスプレイが示しているエラーを訂正します。
サーバーがすべてのプロセッサーをサポートし、プロセッサーの速度とキャッシュ・サイズが相互に一致していることを確認します。
システム・セットアップからプロセッサーの詳細を表示できます。
プロセッサーがサーバーでサポートされているかどうかを判別するには、Lenovo ServerProven Web サイト を参照してください。
(トレーニングを受けた技術員のみ) プロセッサー 1 およびプロセッサー 2 が正しく取り付けられていることを確認します。
(トレーニングを受けた技術員のみ) サーバーを再起動します。
次のコンポーネントを、リストに示されている順序で一度に 1 つずつ交換し、そのたびにサーバーを再起動します。
(トレーニングを受けた技術員のみ) プロセッサー
(トレーニングを受けた技術員のみ) システム・ボード (システム・ボード・アセンブリー)
サーバーが応答しない (POST が完了し、オペレーティング・システムが稼働している)
計算ノードの設置場所にいる場合は、以下のステップを実行してください。
KVM 接続を使用している場合、その接続が正常に機能していることを確認します。使用していない場合は、キーボードおよびマウスが正常に機能していることを確認します。
可能な場合、計算ノードにログインし、すべてのアプリケーションが稼働している (ハングしているアプリケーションがない) ことを確認します。
計算ノードを再起動します。
問題が解決しない場合は、すべての新規ソフトウェアが正しくインストールおよび構成されていることを確認します。
ソフトウェアの購入先またはソフトウェア・プロバイダーに連絡します。
リモート・ロケーションから計算ノードにアクセスしている場合は、以下のステップを実行してください。
すべてのアプリケーションが稼働している (ハングしているアプリケーションがない) ことを確認します。
システムからログアウトしてから、再度ログインしてみます。
コマンド・ラインから計算ノードに対して ping または traceroute を実行してネットワーク・アクセスを検証します。
ping テスト中に応答が得られない場合は、エンクロージャー内の別の計算ノードに ping を試行し、接続の問題であるのか、計算ノードの問題であるのかを判別します。
trace route を実行し、接続が切断されている場所を判別します。VPN あるいは接続が切断されているポイントの接続の問題の解決を試行します。
管理インターフェースから計算ノードをリモートで再起動します。
問題が解決しない場合は、すべての新規ソフトウェアが正しくインストールおよび構成されていることを確認します。
ソフトウェアの購入先またはソフトウェア・プロバイダーに連絡します。
サーバーが応答しない (POST が失敗し、System Setup を起動できない)
デバイスの追加やアダプターのファームウェア更新などの構成変更、およびファームウェアまたはアプリケーションのコードの問題により、サーバーの POST (電源オン・セルフテスト) が失敗することがあります。
サーバーは自動的に再起動し、POST を再試行します。
サーバーは停止し、ユーザーはサーバーの POST を再試行するために、サーバーを手動で再起動する必要があります。
指定された回数の連続試行 (自動でも手動でも) の後、サーバーはデフォルトの UEFI 構成に復帰し、System Setup が開始され、ユーザーが構成に対し必要な修正を加えてサーバーを再起動できるようにします。サーバーがデフォルトの構成で POST を正常に完了できない場合、システム・ボード (システム・ボード・アセンブリー) に問題がある可能性があります。System Setup で、再起動の連続試行数を指定できます。
をクリックします。選択可能なオプションは、3、6、9、255 です。電圧プレーナー障害がイベント・ログに表示される
システムを最小構成に戻します。最低限必要なプロセッサーと DIMM の数については、仕様を参照してください。
システムを再起動します。
- システムが再起動する場合は、取り外した部品を一度に 1 つずつ追加して、そのたびにシステムを再起動し、これをエラーが発生するまで繰り返します。エラーが発生した部品を交換します。
システムが再起動しない場合は、システム・ボード (システム・ボード・アセンブリー) が原因の可能性があります。
サーバーが高温になっているように見える
問題が解決するまで、以下のステップを実行します。
複数の計算ノードまたはシャーシの場合:
- 室温、吸気口の水温、流量が指定された範囲に収まっていることを確認します (仕様を参照)。
UEFI および XCC ファームウェアを最新のバージョンに更新します。
サーバーのフィラーが正しく取り付けられていることを確認します (詳細な取り付け手順については、ハードウェア交換手順を参照)。
- 管理プロセッサーのイベント・ログで、温度上昇イベントがないかを確認します。イベントがない場合、計算ノードは正常な作動温度内で稼働しています。ある程度の温度変化は予想されるので注意してください。
部品またはシャーシが破損している
Lenovo サポートに連絡してください。