跳至主要内容

可觀察的問題

使用此資訊可解決可觀察的問題。

伺服器在 UEFI 開機處理程序期間當機

如果系統在 UEFI 開機處理期間當機並在顯示器上出現訊息 UEFI: DXE INIT,請確定 Option ROM 未使用傳統的設定進行配置。您可以使用 Lenovo XClarity Essentials OneCLI 執行下列指令,以遠端檢視 Option ROM 的目前設定:

onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress

若要回復在開機處理程序期間使用舊式 Option ROM 設定而當機的系統,請查看下列 Tech 提示:

當 Option ROM 設定配置為 Legacy 時,ThinkSystem 伺服器會在 UEFI 開機期間當機並顯示「UEFI:DXE INIT」

如果必須使用舊式 Option ROM,請勿在「裝置與 I/O 埠」功能表上將插槽 Option ROM 設定為傳統。請將插槽 Option ROM 改成設定為自動(預設設定),然後將「系統開機模式」設定為傳統模式。呼叫舊式 Option ROM 後不久,系統就會開機。

啟動伺服器時,伺服器立即顯示 POST 事件檢視器

請完成下列步驟,直到解決問題為止。
  1. 更正系統 LED 和診斷顯示器所指出的任何錯誤。

  2. 確定伺服器支援所有處理器,且處理器的速度和快取大小相符。

    您可以從系統設定檢視處理器詳細資料。

    若要判斷伺服器是否支援處理器,請參閱 Lenovo ServerProven 網站

  3. (僅限經過培訓的維修技術人員)確定已正確安裝處理器 1。

  4. (僅限經過培訓的維修技術人員)卸下處理器 2 並重新啟動伺服器。

  5. 依顯示的順序更換下列元件(一次一個),每次都重新啟動伺服器:

    1. (僅限經過培訓的維修技術人員)處理器

    2. (僅限經過培訓的維修技術人員)主機板

伺服器沒有回應(POST 已完成且作業系統正在執行中)

請完成下列步驟,直到解決問題為止。
  • 如果與計算節點位於同一位置,請完成下列步驟:

    1. 如果是使用 KVM 連線,請確定連線正常運作。否則,請確定鍵盤及滑鼠皆正常運作。

    2. 如果可能,請登入計算節點並確定所有應用程式均在執行中(沒有任何應用程式當機)。

    3. 重新啟動計算節點。

    4. 如果問題仍然存在,請確定是否已正確安裝及配置任何新軟體。

    5. 與您購買軟體的商家或軟體提供者聯絡。

  • 如果是從遠端位置存取計算節點,請完成下列步驟:

    1. 確定所有應用程式均在執行中(沒有任何應用程式當機)。

    2. 嘗試登出系統,然後重新登入。

    3. 透過從指令行對計算節點進行連線測試或執行追蹤路徑,來驗證網路存取權。

      1. 如果您在連線測試期間無法取得回應,請嘗試對機體中的其他計算節點進行連線測試,以判斷這是連線問題還是計算節點問題。

      2. 執行追蹤路徑,以判斷連線岔斷位置。嘗試解決 VPN 或連線岔斷點的連線問題。

    4. 透過管理介面遠端重新啟動計算節點。

    5. 如果問題仍然存在,請檢查是否已正確安裝及配置所有新軟體。

    6. 與您購買軟體的商家或軟體提供者聯絡。

伺服器沒有回應(POST 失敗而且無法啟動 System Setup)

配置變更(例如新增裝置或配接卡韌體更新)以及韌體或應用程式碼問題,可能導致伺服器無法 POST(開機自我測試)。

若發生此狀況,伺服器會以下列一種方式回應:
  • 伺服器自動重新啟動,並再次嘗試 POST。

  • 伺服器當機,您必須手動重新啟動伺服器,讓伺服器再次嘗試 POST。

在連續嘗試指定的次數之後(自動或手動),伺服器回復到預設 UEFI 配置並啟動系統設定,讓您能夠對配置進行必要的更正再重新啟動伺服器。如果伺服器無法以預設配置順利完成 POST,表示主機板可能有問題。

您可以在系統設定中指定連續嘗試重新啟動的次數。重新啟動伺服器,然後根據畫面上的指示按下指定按鍵以顯示 LXPM 系統設定介面。如需相關資訊,請參閱與您伺服器相容的 LXPM 文件中的啟動一節,網址為 Lenovo XClarity Provisioning Manager 入口網站頁面然後,按一下系統設定 > 回復和 RAS > POST 嘗試 > POST 嘗試限制。可用的選項為 3、6、9 和 disable。

事件日誌中顯示電壓介面板故障

請完成下列步驟,直到解決問題為止。
  1. 將伺服器回復至最低配置。如需處理器和 DIMM 的最低所需數目,請參閱規格

  2. 重新啟動系統。

    • 如果系統重新啟動,請一次新增一個您所卸下的項目,每次新增後都重新啟動系統,直到發生錯誤為止。更換發生此錯誤的項目。

    • 如果系統未重新啟動,問題有可能在於主機板。

異味

請完成下列步驟,直到解決問題為止。

  1. 異味可能來自新安裝的設備。
  2. 如果問題仍然存在,請聯絡 Lenovo 支援中心。

伺服器似乎在過熱狀態下執行

請完成下列步驟,直到解決問題為止。

多個計算節點或機箱:

  1. 確定室溫在指定範圍內(請參閱規格)。
  2. 確定風扇的安裝正確。

  3. 將 UEFI 和 XCC 更新為最新版本。

  4. 確定已正確安裝伺服器中的填充板(請參閱硬體更換程序以瞭解詳細的安裝程序)。

  5. 使用 IPMI 命令將風扇速度提高到最高風扇速度,以查看是否可以解決問題。

    IPMI raw 命令只能由經過培訓的技術人員使用,而且每個系統有其自己特定的 IPMI raw 命令。
  6. 請檢查管理處理器事件日誌中是否出現溫度事件。如果沒有任何事件,則表示計算節點在正常作業溫度範圍內執行。請注意,溫度可能會產生一些變化。

安裝新配接卡後無法進入舊版模式

請完成下列程序以解決問題。

  1. 前往 UEFI 設定 > 裝置與 I/O 埠 > 設定 Option ROM 執行順序
  2. 將安裝了作業系統的 RAID 配接卡移到清單的頂部。
  3. 選取儲存
  4. 重新啟動系統並自動啟動到作業系統。

零件或機箱破裂

請聯絡 Lenovo 支援中心。