跳至主要内容

可觀察的問題

使用此資訊可解決可觀察的問題。

伺服器在 UEFI 開機處理程序期間當機

如果系統在 UEFI 開機處理期間當機並在顯示器上出現訊息 UEFI: DXE INIT,請確定 Option ROM 未使用傳統的設定進行配置。您可以使用 Lenovo XClarity Essentials OneCLI 執行下列指令,以遠端檢視 Option ROM 的目前設定:

onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress

若要回復在開機處理程序期間使用傳統 Option ROM 設定而當機的系統,請查看下列 Tech 提示:

當 Option ROM 設定配置為 Legacy 時,ThinkSystem 伺服器會在 UEFI 開機期間當機並顯示「UEFI:DXE INIT」

如果必須使用舊式 Option ROM,請勿在「裝置與 I/O 埠」功能表上將插槽 Option ROM 設定為傳統。請將插槽 Option ROM 改成設定為自動(預設設定),然後將「系統開機模式」設定為傳統模式。呼叫傳統 Option ROM 後不久,系統就會開機。

啟動伺服器時,伺服器立即顯示 POST 事件檢視器

請完成下列步驟,直到解決問題為止。
  1. 更正前方操作面板和錯誤 LED 所指出的任何錯誤。

  2. 確定伺服器支援處理器,且處理器的速度和快取大小相符。

    您可以從系統設定檢視處理器詳細資料。

    若要判斷伺服器是否支援處理器,請參閱 Lenovo ServerProven 網站

  3. (僅限經過培訓的技術人員)確定已正確安裝主機板

  4. (僅限經過培訓的維修技術人員)確定已正確安裝處理器

  5. 依顯示的順序更換下列元件(一次一個),每次都重新啟動伺服器:

    1. (僅限經過培訓的維修技術人員)處理器

    2. (僅限經過培訓的維修技術人員)主機板

伺服器沒有回應(POST 已完成且作業系統正在執行中)

請完成下列步驟,直到解決問題為止。
  • 如果與伺服器位於同一位置,請完成下列步驟:

    1. 如果是使用 KVM 連線,請確定連線正常運作。否則,請確定鍵盤及滑鼠皆正常運作。

    2. 如果可能,請登入伺服器並確定所有應用程式均在執行中(沒有任何應用程式當機)。

    3. 重新啟動伺服器。

    4. 如果問題仍然存在,請確定是否已正確安裝及配置任何新軟體。

    5. 與您購買軟體的商家或軟體提供者聯絡。

  • 如果是從遠端位置存取伺服器,請完成下列步驟:

    1. 確定所有應用程式均在執行中(沒有任何應用程式當機)。

    2. 嘗試登出系統,然後重新登入。

    3. 透過從指令行對伺服器進行連線測試或執行追蹤路徑,來驗證網路存取權。

      1. 如果您在連線測試期間無法取得回應,請嘗試對機體中的其他伺服器進行連線測試,以判斷這是連線問題還是伺服器問題。

      2. 執行追蹤路徑,以判斷連線岔斷位置。嘗試解決 VPN 或連線岔斷點的連線問題。

    4. 透過管理介面遠端重新啟動伺服器。

    5. 如果問題仍然存在,請檢查是否已正確安裝及配置所有新軟體。

    6. 與您購買軟體的商家或軟體提供者聯絡。

伺服器沒有回應(POST 失敗而且無法啟動 System Setup)

配置變更(例如新增裝置或配接卡韌體更新)以及韌體或應用程式碼問題,可能導致伺服器無法 POST(開機自我測試)。

若發生此狀況,伺服器會以下列一種方式回應:
  • 伺服器自動重新啟動,並再次嘗試 POST。

  • 伺服器當機,您必須手動重新啟動伺服器,讓伺服器再次嘗試 POST。

在連續嘗試指定的次數之後(自動或手動),伺服器回復到預設 UEFI 配置並啟動系統設定,讓您能夠對配置進行必要的更正再重新啟動伺服器。如果伺服器無法以預設配置順利完成 POST,表示主機板可能有問題。

您可以在 System Setup 中指定連續嘗試重新啟動的次數。重新啟動伺服器,然後根據畫面上的指示按下指定按鍵以顯示 LXPM 系統設定介面。(如需相關資訊,請參閱與您伺服器相容的 LXPM 文件中的「啟動」一節,網址為 Lenovo XClarity Provisioning Manager 入口網站頁面。)然後,按一下系統設定 > 回復和 RAS > POST 嘗試 > POST 嘗試限制。可用的選項為 3、6、9 和 disable。

事件日誌中顯示電壓介面板故障

請完成下列步驟,直到解決問題為止。
  1. 將伺服器回復至最低配置。如需處理器和 DIMM 的最低所需數目,請參閱規格

  2. 重新啟動系統。

    • 如果系統重新啟動,請一次新增一個您所卸下的項目,每次新增後都重新啟動系統,直到發生錯誤為止。更換發生此錯誤的項目。

    • 如果系統未重新啟動,問題有可能在於主機板。

異味

請完成下列步驟,直到解決問題為止。

  1. 異味可能來自新安裝的設備。
  2. 如果問題仍然存在,請聯絡 Lenovo 支援中心。

伺服器似乎在過熱狀態下執行

請完成下列步驟,直到解決問題為止。

多個伺服器或機箱:

  1. 確定室溫在指定範圍內(請參閱規格)。
  2. 確定風扇的安裝正確。

  3. 將 UEFI 和 XCC 更新為最新版本。

  4. 確定已正確安裝伺服器中的填充板(請參閱維護手冊以瞭解詳細的安裝程序)。

  5. 使用 IPMI 命令將風扇速度提高到最高風扇速度,以查看是否可以解決問題。

    IPMI raw 命令只能由經過培訓的技術人員使用,而且每個系統有其自己特定的 PMI raw 命令。
  6. 請檢查管理處理器事件日誌中是否出現溫度事件。如果沒有任何事件,則表示伺服器在正常作業溫度範圍內執行。請注意,溫度可能會產生一些變化。

零件或機箱破裂

請聯絡 Lenovo 支援中心。