Перейти к основному содержимому

Неполадки с памятью

В этом разделе представлены сведения по устранению неполадок, связанных с памятью.

Несколько модулей памяти определены как неисправные или отключенные

Выполните следующие действия, чтобы решить проблему.

  1. Проверьте журнал XCC, чтобы узнать, неисправен ли один из отключенных модулей. Если да, замените неисправный модуль и запустите систему, чтобы проверить, правильно ли распознаются все модули.
    Прим.
    Если модуль памяти неисправен, система понизит уровень памяти до ближайшей поддерживаемой комбинации, в то время как некоторые установленные модули памяти не будут распознаваться системой.
  2. Установите модули памяти, а затем перезапустите сервер.
  3. Извлеките модуль памяти с наибольшим номером среди определенных как неисправные и замените его идентичным исправным модулем памяти. Затем перезапустите сервер. При необходимости повторите эту операцию. Если после замены всех модулей памяти, определенных как неисправные, сбои продолжаются, перейдите к шагу 4.
  4. Установите обратно извлеченные модули памяти (по очереди) в исходные разъемы, перезапуская сервер после установки каждого модуля памяти, пока не обнаружите неисправный модуль. Замените все неисправные модули памяти идентичными исправными модулями, перезапуская сервер после замены каждого модуля памяти. Повторяйте шаг 3, пока не проверите все извлеченные модули памяти.
  5. Замените модуль памяти с наибольшим номером среди определенных как неисправные и перезапустите сервер. При необходимости повторите эту операцию.
  6. Переставьте в обратном порядке модули памяти между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.
  7. (Только для квалифицированных специалистов). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.
  8. (Только для квалифицированных специалистов). Замените материнскую плату.

Отображаемая системная память меньше установленной физической памяти

Выполните следующие действия, чтобы решить проблему.

Прим.
При каждой установке или снятии модуля памяти необходимо отключать сервер от источника питания и перед перезагрузкой сервера ожидать в течение 10 секунд.
  1. Убедитесь в выполнении указанных ниже условий.
    • На информационной панели оператора не горят никакие индикаторы ошибок.

    • На материнской плате не горят никакие индикаторы ошибок модуля памяти.

    • Зеркальный канал памяти не учитывает несоответствие.

    • Модули памяти установлены правильно.

    • Установлен модуль памяти правильного типа (см. требования в разделе Правила PMEM).

    • После замены модуля памяти конфигурация памяти обновляется соответствующим образом в Setup Utility.

    • Включены все банки памяти. При обнаружении неполадки сервер, возможно, автоматически отключил банк памяти или банк памяти мог быть отключен вручную.

    • При минимальной конфигурации памяти сервера не существует несоответствия памяти.

    • Если установлены модули PMEM:

      1. Ознакомьтесь с информацией в разделе Правила PMEM и определите, соответствует ли отображаемая память описанию режима.

      2. Созданы резервные копии всех сохраненных данных, и созданные пространства имен удалены до замены или добавления какого-либо модуля PMEM.

      3. Перейдите в Setup Utility, выберите Управление конфигурацией и загрузкой системы > Модули Intel Optane PMEM > Безопасность и убедитесь, что безопасность всех модулей PMEM отключена.

  2. Извлеките и снова установите модули памяти, а затем перезапустите сервер.

  3. Проверьте журнал ошибок POST:

    • Если модуль памяти был отключен прерыванием управления системой (SMI), замените его.

    • Если модуль памяти был отключен пользователем или тестом POST, извлеките и снова вставьте его, а затем запустите программу Setup Utility и включите модуль памяти.

  4. Запустите диагностику памяти. При запуске решения и нажатии клавиши в соответствии с инструкциями на экране по умолчанию отображается интерфейс Lenovo XClarity Provisioning Manager. Диагностику памяти можно выполнить из этого интерфейса. На странице «Диагностика» нажмите Выполнить диагностику > Тест памяти или Тест PMEM.

    Прим.
    Если установлены модули PMEM, выполните диагностику на основании режима, заданного в данный момент.
    • Режим App Direct:

      • Запустите тест памяти для модулей памяти DRAM.

      • Запустите тест PMEM для модулей PMEM.

  5. Переставьте в обратном порядке модули между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.

  6. Реактивируйте все модули памяти с помощью программы Setup Utility и перезапустите сервер.

  7. (Только для квалифицированных специалистов). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.

  8. (Только для квалифицированных специалистов). Замените материнскую плату.

Обнаружено неправильное заполнение памяти

Если отображается это предупреждение, выполните следующие действия:
Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
  1. Чтобы убедиться, что текущая последовательность заполнения модулей памяти поддерживается, см. раздел Правила и порядок установки модулей памяти.
  2. Если текущая последовательность поддерживается, проверьте, отображается ли для каких-либо модулей статус «отключено» в Setup Utility.
  3. Переустановите модуль со статусом «отключено» и перезагрузите систему.
  4. Если проблема сохраняется, замените модуль памяти со статусом «Отключено».

В регионе с чередованием отображается дополнительное пространство имен

Если в одном регионе с чередованием существует два пространства имен, VMware ESXi игнорирует созданные пространства имен и создает дополнительное новое пространство имен при загрузке системы. Удалите созданные пространства имен в Setup Utility или операционной системе перед первой загрузкой с помощью ESXi.

Перенесенные модули PMEM не поддерживаются

Если отображается это предупреждение, выполните следующие действия:
Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
  1. Переместите модули обратно в исходную систему с точно такой же конфигурацией, как и ранее.
  2. Создайте резервную копию сохраненных данных в пространствах имен PMEM.
  3. Отключите безопасность PMEM одним из следующих способов:
    • LXPM

      Выберите команду Настройка UEFI > Системные параметры > Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить безопасность.

    • Setup Utility

      Выберите команду Управление конфигурацией и загрузкой системы > Параметры системы > Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить безопасность.

  4. Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
    • Команда Linux:

      ndctl destroy-namespace all -f

    • Команда Windows Powershell:

      Get-PmemDisk | Remove-PmemDisk

  5. Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).

    ipmctl delete -pcd
    Прим.
    Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам:
  6. Перезагрузите систему и нажмите клавишу F1, чтобы войти в программу Setup Utility.
  7. Выключите систему.
  8. Удалите модули, которые необходимо использовать повторно для новой системы или конфигурации.

Модули PMEM установлены в неправильные гнезда после замены материнской платы

Если отображается это предупреждение, выполните следующие действия:
DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
  1. Запишите каждую из инструкций изменения гнезда PMEM из событий XCC.
  2. Отключите системы и извлеките модули PMEM, упомянутые в предупреждениях. Рекомендуется пометить эти модули PMEM, чтобы избежать путаницы.
  3. Установите модули PMEM в гнезда с правильными номерами, указанными в предупреждениях. Снимите метки, чтобы они не мешали воздушному потоку и охлаждению.
  4. Завершите замену и включите систему. Убедитесь, что в XCC нет аналогичных предупреждений.
Прим.
Не выполняйте подготовку с модулями PMEM во избежание потери данных, если в событиях XCC по-прежнему есть предупреждения.

После перенастройки модулей PMEM сообщения об ошибках и светодиодные индикаторы продолжают сообщать, что модули PMEM установлены в неправильные гнезда

Чтобы устранить эту проблему, выключите и включите систему или перезапустите XCC.

Невозможно успешно создать цель при установке модулей PMEM в систему в первый раз

Если отображается одно из следующих сообщений:
  • ОШИБКА: невозможно получить сведения о ресурсах памяти
  • ОШИБКА: один или несколько модулей PMEM не имеют данных PCD. Для восстановления допустимых данных PCD рекомендуется выполнить перезагрузку платформы.
Чтобы решить проблему, выполните указанные ниже действия.
  1. Если модули PMEM были установлены в другой системе с сохраненными данными, выполните указанные ниже действия, чтобы удалить данные.
    1. На основе исходного порядка заполнения установите модули PMEM в исходную систему, где они были установлены ранее, и создайте резервную копию данных из модулей PMEM на других устройствах хранения данных.
    2. Отключите безопасность PMEM одним из следующих способов:
      • LXPM

        Выберите команду Настройка UEFI > Системные параметры > Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить безопасность.

      • Setup Utility

        Выберите команду Управление конфигурацией и загрузкой системы > Параметры системы > Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить безопасность.

    3. Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
      • Команда Linux:

        ndctl destroy-namespace all -f

      • Команда Windows Powershell:

        Get-PmemDisk | Remove-PmemDisk

    4. Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).

      ipmctl delete -pcd
      Прим.
      Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам:
  2. Установите модули PMEM обратно в целевую систему и обновите микропрограмму системы до последней версии без входа в программу Setup Utility.
  3. Если проблема сохраняется, перезапишите модули PMEM с помощью следующей команды ndctl.
    ndctl sanitize-dimm --overwrite all
  4. Отслеживайте состояние перезаписи с помощью следующей команды.
    watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
  5. Когда все модули PMEM получат статус OverwriteStatus=Completed, перезагрузите систему и проверьте, сохранилась ли проблема.