跳至主要内容

記憶體問題

使用此資訊解決記憶體相關問題。

顯示的系統記憶體小於已安裝的實體記憶體

請完成下列步驟,直到解決問題為止:
每次安裝或卸下記憶體模組時,您必須中斷伺服器與電源的連接,然後等待 10 秒再重新啟動伺服器。
  1. 請確認:
    • 操作員資訊面板上沒有錯誤 LED 亮燈。

    • 主機板上沒有記憶體模組錯誤 LED 亮燈。

    • 記憶體鏡映通道不是導致此不相符狀況的原因。

    • 已正確安裝記憶體模組。

    • 您已安裝正確類型的記憶體模組(若要瞭解需求,請參閱規格DC Persistent Memory Module (DCPMM) 設定)。

    • 在變更或更換記憶體模組後,記憶體配置也會相應地在 Setup Utility 中更新。

    • 已啟用所有記憶體儲存庫。伺服器可能在偵測到問題時已自動停用記憶體儲存庫,或您可能已手動停用記憶體儲存庫。

    • 當伺服器使用基本記憶體配置時,沒有記憶體不符的狀況。

    • 安裝了 DCPMM 時:

      1. 如果記憶體是在應用直連或混合記憶體模式中設定,則所有儲存的資料皆已備份,並且在更換任何 DCPMM 之前已刪除所建立的命名空間。

      2. 請參閱中的「Intel Optane DC Persistent Memory (DCPMM) 設定」DC Persistent Memory Module (DCPMM) 設定,並查看顯示的記憶體是否符合模式說明。

      3. 如果 DCPMM 是最近在記憶體模式中所設定,請將其改回應用直連模式,並檢查是否有尚未刪除的命名空間(請參閱DC Persistent Memory Module (DCPMM) 設定)。

      4. 請移至 Setup Utility,選取系統配置和開機管理 > Intel Optane DCPMM > 安全性,並確定所有的 DCPMM 裝置都已解除鎖定。

  2. 重新安裝記憶體模組,然後重新啟動伺服器。

  3. 查看 POST 錯誤日誌:

    • 如果記憶體模組是由系統管理岔斷 (SMI) 所停用,請更換記憶體模組。

    • 如果記憶體模組是由使用者或由 POST 所停用,請重新安裝記憶體模組,然後執行 Setup Utility 並啟用該記憶體模組。

  4. 執行記憶體診斷。當您啟動解決方案,然後根據畫面上的指示按下指定按鍵時,預設會顯示 LXPM 介面。(如需相關資訊,請參閱與您伺服器相容的 LXPM 文件中的「啟動」一節,網址為 Lenovo XClarity Provisioning Manager 入口網站頁面。)您可以使用此介面執行記憶體診斷。從「診斷」頁面移至執行診斷 > 記憶體測試DCPMM 測試

    安裝了 DCPMM 時,請根據目前設定的模式來執行診斷:
    • 應用直連模式:

      • 針對 DRAM 記憶體模組執行記憶體測試。

      • 針對 DCPMM 執行 DCPMM 測試。

    • 記憶體模式和混合記憶體模式:

      針對 DCPMM 同時執行記憶體測試和 DCPMM 測試。

  5. 將(相同處理器之)通道間的模組互換,然後重新啟動伺服器。若問題與記憶體模組相關,請更換故障的記憶體模組。
    安裝了 DCPMM 時,只能在記憶體模式中採用此方法。
  6. 使用 Setup Utility 重新啟用所有記憶體模組,然後重新啟動伺服器。

  7. (僅限經過培訓的維修技術人員)將故障的記憶體模組安裝到處理器 2(如有安裝)的記憶體模組接頭,以確認問題不在處理器或記憶體模組接頭上。

  8. (僅限經過培訓的維修技術人員)更換主機板。

通道中的多個記憶體模組被視為故障

每次安裝或卸下記憶體模組時,您必須中斷伺服器與電源的連接,然後等待 10 秒再重新啟動伺服器。
  1. 重新安裝記憶體模組,然後重新啟動伺服器。
  2. 從所有找出的記憶體模組中卸下編號最高的記憶體模組,並使用已知良好的相同記憶體模組加以更換,然後重新啟動伺服器。視需要重複此動作。若更換所有找出的記憶體模組之後故障仍然存在,請進入步驟 4。
  3. 一次將一個卸下的記憶體模組裝回原始接頭,並且每裝回一個記憶體模組就重新啟動伺服器,直到記憶體模組發生故障為止。使用已知良好的相同記憶體模組更換每一個故障的記憶體模組,並在更換每一個記憶體模組之後重新啟動伺服器。重複步驟 3,直到已測試所有卸下的記憶體模組為止。
  4. 從所有找出的記憶體模組中更換編號最高的記憶體模組,然後重新啟動伺服器。視需要重複此動作。
  5. 將(相同處理器之)通道間的記憶體模組互換,然後重新啟動伺服器。若問題與記憶體模組相關,請更換故障的記憶體模組。
  6. (僅限經過培訓的維修技術人員)將故障的記憶體模組安裝到處理器 2(如有安裝)的記憶體模組接頭,以確認問題不在處理器或記憶體模組接頭上。
  7. (僅限經過培訓的維修技術人員)更換主機板

嘗試變更為其他 DCPMM 模式失敗

在變更 DCPMM 模式且順利重新啟動系統之後,如果 DCPMM 模式保持不變未更改,請檢查 DRAM DIMM 和 DCPMM 容量,查看是否符合新模式的需求(請參閱中的「Intel Optane DC Persistent Memory (DCPMM) 設定DC Persistent Memory Module (DCPMM) 設定)。

交錯區域中出現額外的命名空間

如果一個交錯區域中有兩個已建立的命名空間,VMware ESXi 會忽略已建立的命名空間,而在系統開機期間建立額外的新命名空間。在初次使用 ESXi 開機之前,請刪除 Setup Utility 或作業系統中已建立的命名空間。