Перейти к основному содержимому

Неполадки с памятью

В этом разделе представлены сведения по устранению неполадок, связанных с памятью.

Отображаемая системная память меньше установленной физической памяти

Выполните следующие действия, чтобы решить проблему.

Прим.
При каждой установке или снятии модуля памяти необходимо отключать сервер от источника питания и перед перезагрузкой сервера ожидать в течение 10 секунд.
  1. Убедитесь в выполнении указанных ниже условий.
    • На информационной панели оператора не горят никакие индикаторы ошибок.

    • На материнской плате не горят никакие индикаторы ошибок модуля памяти.

    • Зеркальный канал памяти не учитывает несоответствие.

    • Модули памяти установлены правильно.

    • Установлен модуль памяти правильного типа (см. требования в разделе Правила PMEM).

    • После замены модуля памяти конфигурация памяти обновляется соответствующим образом в Setup Utility.

    • Включены все банки памяти. При обнаружении неполадки сервер, возможно, автоматически отключил банк памяти или банк памяти мог быть отключен вручную.

    • При минимальной конфигурации памяти сервера не существует несоответствия памяти.

    • Если установлены модули PMEM:

      1. Ознакомьтесь с информацией в разделе Правила PMEM и определите, соответствует ли отображаемая память описанию режима.

      2. Если задан режим памяти App Direct, убедитесь, что создается резервная копия всех сохраненных данных и перед заменой или добавлением любого модуля PMEM созданные пространства имен удаляются.

      3. Если модули PMEM недавно переведены в режим памяти, переключитесь назад на режим App Direct и проверьте, существует ли неудаленное пространство имен.

      4. Перейдите в Setup Utility, выберите Управление конфигурацией и загрузкой системы > Модули Intel Optane PMEM > Безопасность и убедитесь, что безопасность всех модулей PMEM отключена.

  2. Извлеките и снова установите модули памяти, а затем перезапустите сервер.

  3. Проверьте журнал ошибок POST:

    • Если модуль памяти был отключен прерыванием управления системой (SMI), замените его.

    • Если модуль памяти был отключен пользователем или тестом POST, извлеките и снова вставьте его, а затем запустите программу Setup Utility и включите модуль памяти.

  4. Запустите диагностику памяти. При запуске решения и нажатии клавиши в соответствии с инструкциями на экране по умолчанию отображается интерфейс LXPM. (Дополнительные сведения см. в разделе «Запуск» в документации к LXPM, соответствующей вашему серверу, по адресу Страница портала Lenovo XClarity Provisioning Manager.) Диагностику памяти можно выполнить из этого интерфейса. На странице «Диагностика» выберите Выполнить диагностику > Тест памяти или Тест PMEM.

    Прим.
    Если установлены модули PMEM, выполните диагностику на основании режима, заданного в данный момент.
    • Режим App Direct:

      • Запустите тест памяти для модулей памяти DRAM.

      • Запустите тест PMEM для модулей PMEM.

    • Режим памяти:

      Запустите тест памяти и тест PMEM для модулей PMEM.

  5. Переставьте в обратном порядке модули между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.
    Прим.
    Если установлены модули PMEM, используйте этот способ только в режиме памяти.
  6. Реактивируйте все модули памяти с помощью программы Setup Utility и перезапустите сервер.

  7. (Только для квалифицированных специалистов). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.

  8. (Только для квалифицированных специалистов). Замените материнскую плату.

Несколько модулей памяти в канале определены как неисправные

Прим.
При каждой установке или снятии модуля памяти необходимо отключать сервер от источника питания и перед перезагрузкой сервера ожидать в течение 10 секунд.

Выполните следующие действия, чтобы решить проблему.

  1. Установите модули памяти, а затем перезапустите сервер.
  2. Извлеките модуль памяти с наибольшим номером среди определенных как неисправные и замените его идентичным исправным модулем памяти. Затем перезапустите сервер. При необходимости повторите эту операцию. Если после замены всех модулей памяти, определенных как неисправные, сбои продолжаются, перейдите к шагу 4.
  3. Установите обратно извлеченные модули памяти (по очереди) в исходные разъемы, перезапуская сервер после установки каждого модуля памяти, пока не обнаружите неисправный модуль. Замените все неисправные модули памяти идентичными исправными модулями, перезапуская сервер после замены каждого модуля памяти. Повторяйте шаг 3, пока не проверите все извлеченные модули памяти.
  4. Замените модуль памяти с наибольшим номером среди определенных как неисправные и перезапустите сервер. При необходимости повторите эту операцию.
  5. Переставьте в обратном порядке модули памяти между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.
  6. (Только для квалифицированных специалистов по техническому обслуживанию). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.
  7. (Только для квалифицированных специалистов по техническому обслуживанию) Замените материнскую плату.

Попытка перейти на другой режим PMEM завершилась с ошибкой

Если после изменения режима PMEM и перезапуска системы режим PMEM не меняется, проверьте емкость модулей DIMM DRAM и PMEM, чтобы определить, соответствует ли она требованиям нового режима (см. раздел Правила PMEM).

В регионе с чередованием отображается дополнительное пространство имен

Если в одном регионе с чередованием существует два пространства имен, VMware ESXi игнорирует созданные пространства имен и создает дополнительное новое пространство имен при загрузке системы. Удалите созданные пространства имен в Setup Utility или операционной системе перед первой загрузкой с помощью ESXi.

Перенесенные модули PMEM не поддерживаются

Если отображается это предупреждение, выполните следующие действия:
  • Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00). These migrated PMEMs are not supported nor warranted in this system.
  1. Переместите модули обратно в исходную систему с точно такой же конфигурацией, как и ранее.
  2. Создайте резервную копию сохраненных данных в пространствах имен PMEM.
  3. Отключите безопасность PMEM одним из следующих способов:
    • Lenovo XClarity Provisioning Manager

      Выберите Настройка UEFI > Системные параметры > Модули Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить систему безопасности.

    • Setup Utility

      Выберите команду Управление конфигурацией и загрузкой системы > Системные параметры > Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить безопасность.

  4. Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
    • Команда Linux:

      ndctl destroy-namespace all -f 
    • Команда Windows Powershell:

      Get-PmemDisk | Remove-PmemDisk
  5. Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).

    ipmctl delete -pcd
    Прим.
    Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам:
  6. Перезагрузите систему и нажмите клавишу в соответствии с инструкциями на экране, чтобы войти в программу Setup Utility. (Дополнительные сведения см. в разделе «Запуск» в документации к LXPM, соответствующей вашему серверу, по адресу Страница портала Lenovo XClarity Provisioning Manager.)
  7. Выключите систему.
  8. Удалите модули, которые необходимо использовать повторно для новой системы или конфигурации.

Обнаружено неправильное заполнение памяти

  • Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
Если отображается это предупреждение, выполните следующие действия:
  1. Ознакомьтесь с информацией в разделе Правила и порядок установки модулей памяти, чтобы выяснить, поддерживается ли текущая последовательность установки модулей памяти.
  2. Если текущая последовательность поддерживается, проверьте, отображается ли для каких-либо модулей статус «отключено» в Setup Utility.
  3. Переустановите модуль со статусом «отключено» и перезагрузите систему.
  4. Если проблема сохраняется, замените модуль памяти со статусом «отключено».

Модули PMEM установлены в неправильные гнезда после замены материнской платы

  • DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
Если отображается это предупреждение, выполните следующие действия:
  1. Запишите каждую из инструкций изменения гнезда PMEM из событий XCC.
  2. Отключите системы и извлеките модули PMEM, упомянутые в предупреждениях. Рекомендуется пометить эти модули PMEM, чтобы избежать путаницы.
  3. Установите модули PMEM в гнезда с правильными номерами, указанными в предупреждениях. Снимите метки, чтобы они не мешали воздушному потоку и охлаждению.
  4. Завершите замену и включите систему. Убедитесь, что в XCC нет аналогичных предупреждений.
Прим.
Не выполняйте подготовку с модулями PMEM во избежание потери данных, если в событиях XCC по-прежнему есть предупреждения.

После перенастройки модулей PMEM сообщения об ошибках и светодиодные индикаторы продолжают сообщать, что модули PMEM установлены в неправильные гнезда

Чтобы устранить эту проблему, выключите и включите систему или перезапустите XCC.

Невозможно успешно создать цель при установке модулей PMEM в систему в первый раз

Если отображается одно из следующих сообщений:
  • ОШИБКА: невозможно получить сведения о ресурсах памяти
  • ОШИБКА: один или несколько модулей PMEM не имеют данных PCD. Для восстановления допустимых данных PCD рекомендуется выполнить перезагрузку платформы.
Чтобы решить проблему, выполните указанные ниже действия.
  1. Если модули PMEM были установлены в другой системе с сохраненными данными, выполните указанные ниже действия, чтобы удалить данные.
    1. На основе исходного порядка заполнения установите модули PMEM в исходную систему, где они были установлены ранее, и создайте резервную копию данных из модулей PMEM на других устройствах хранения данных.
    2. Отключите безопасность PMEM одним из следующих способов:
      • Lenovo XClarity Provisioning Manager

        Выберите Настройка UEFI > Системные параметры > Модули Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить систему безопасности.

      • Setup Utility

        Выберите команду Управление конфигурацией и загрузкой системы > Системные параметры > Intel Optane PMEM > Безопасность > Нажмите, чтобы отключить безопасность и введите парольную фразу, чтобы отключить безопасность.

    3. Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
      • Команда Linux:

        ndctl destroy-namespace all -f 
      • Команда Windows Powershell:

        Get-PmemDisk | Remove-PmemDisk
    4. Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).

      ipmctl delete -pcd
      Прим.
      Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам:
  2. Установите модули PMEM обратно в целевую систему и обновите микропрограмму системы до последней версии без входа в программу Setup Utility.
  3. Если проблема сохраняется, перезапишите модули PMEM с помощью следующей команды ndctl.

    ndctl sanitize-dimm --overwrite all

  4. Отслеживайте состояние перезаписи с помощью следующей команды.

    watch -n 1 “ipmctl show -d OverwriteStatus -dimm”

  5. Когда все модули PMEM получат статус OverwriteStatus=Completed, перезагрузите систему и проверьте, сохранилась ли проблема.