可觀察的問題
使用此資訊可解決可觀察的問題。
伺服器在 UEFI 開機處理程序期間當機
如果系統在 UEFI 開機處理期間當機並在顯示器上出現訊息 UEFI: DXE INIT,請確定 Option ROM 未使用傳統的設定進行配置。您可以使用 Lenovo XClarity Essentials OneCLI 執行下列指令,以遠端檢視 Option ROM 的目前設定:
onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress
若要回復在開機處理程序期間使用舊式 Option ROM 設定而當機的系統,請查看下列 Tech 提示:
當 Option ROM 設定配置為 Legacy 時,ThinkSystem 伺服器會在 UEFI 開機期間當機並顯示「UEFI:DXE INIT」
如果必須使用舊式 Option ROM,請勿在「裝置與 I/O 埠」功能表上將插槽 Option ROM 設定為傳統。請將插槽 Option ROM 改成設定為自動(預設設定),然後將「系統開機模式」設定為傳統模式。呼叫舊式 Option ROM 後不久,系統就會開機。
啟動伺服器時,伺服器立即顯示 POST 事件檢視器
更正 Lightpath 診斷 LED 所指出的任何錯誤。
確定伺服器支援所有處理器,且處理器的速度和快取大小相符。
您可以從系統設定檢視處理器詳細資料。
若要判斷伺服器是否支援處理器,請參閱 Lenovo ServerProven 網站。
(僅限經過培訓的維修技術人員)確定已正確安裝處理器 1
(僅限經過培訓的維修技術人員)卸下處理器 2 並重新啟動伺服器。
依顯示的順序更換下列元件(一次一個),每次都重新啟動伺服器:
(僅限經過培訓的維修技術人員)處理器
(僅限經過培訓的維修技術人員)主機板
伺服器沒有回應(POST 已完成且作業系統正在執行中)
如果與伺服器位於同一位置,請完成下列步驟:
如果是使用 KVM 連線,請確定連線正常運作。否則,請確定鍵盤及滑鼠皆正常運作。
如果可能,請登入伺服器並確定所有應用程式均在執行中(沒有任何應用程式當機)。
重新啟動伺服器。
如果問題仍然存在,請確定是否已正確安裝及配置任何新軟體。
與您購買軟體的商家或軟體提供者聯絡。
如果是從遠端位置存取伺服器,請完成下列步驟:
確定所有應用程式均在執行中(沒有任何應用程式當機)。
嘗試登出系統,然後重新登入。
透過從指令行對伺服器進行連線測試或執行追蹤路徑,來驗證網路存取權。
如果您在連線測試期間無法取得回應,請嘗試對機體中的其他伺服器進行連線測試,以判斷這是連線問題還是伺服器問題。
執行追蹤路徑,以判斷連線岔斷位置。嘗試解決 VPN 或連線岔斷點的連線問題。
透過管理介面遠端重新啟動伺服器。
如果問題仍然存在,請檢查是否已正確安裝及配置所有新軟體。
與您購買軟體的商家或軟體提供者聯絡。
伺服器沒有回應(POST 失敗而且無法啟動 System Setup)
配置變更(例如新增裝置或配接卡韌體更新)以及韌體或應用程式碼問題,可能導致伺服器無法 POST(開機自我測試)。
伺服器自動重新啟動,並再次嘗試 POST。
伺服器當機,您必須手動重新啟動伺服器,讓伺服器再次嘗試 POST。
在連續嘗試指定的次數之後(自動或手動),伺服器回復到預設 UEFI 配置並啟動系統設定,讓您能夠對配置進行必要的更正再重新啟動伺服器。如果伺服器無法以預設配置順利完成 POST,表示主機板可能有問題。
您可以在系統設定中指定連續嘗試重新啟動的次數。重新啟動伺服器,然後根據畫面上的指示按下指定按鍵以顯示 Lenovo XClarity Provisioning Manager 系統設定介面。然後,按一下 。可用的選項為 3、6、9 和 disable。
如果以上所述動作無法解決問題,請聯絡服務團隊以檢閱問題症狀,並確認是否需要更換主機板。
事件日誌中顯示電壓介面板故障
將伺服器回復至最低配置。如需處理器和 DIMM 的最低所需數目,請參閱技術規格。
重新啟動系統。
如果系統重新啟動,請一次新增一個您所卸下的項目,每次新增後都重新啟動系統,直到發生錯誤為止。更換發生此錯誤的項目。
如果系統未重新啟動,問題有可能在於主機板。
伺服器似乎在過熱狀態下執行
請完成下列步驟,直到解決問題為止。
多個伺服器或機箱:
- 確定室溫在指定範圍內(請參閱技術規格)。
確定風扇的安裝正確。
將 UEFI 和 XCC 更新為最新版本。
確定已正確安裝伺服器中的填充板(請參閱維護手冊以瞭解詳細的安裝程序)。
使用 IPMI 命令將風扇速度提高到最高風扇速度,以查看是否可以解決問題。
註IPMI raw 命令只能由經過培訓的技術人員使用,而且每個系統有其自己特定的 PMI raw 命令。- 請檢查管理處理器事件日誌中是否出現溫度事件。如果沒有任何事件,則表示伺服器在正常作業溫度範圍內執行。請注意,溫度可能會產生一些變化。
零件或機箱破裂
請聯絡 Lenovo 支援中心。