Неполадки с памятью
В этом разделе представлены сведения по устранению неполадок, связанных с памятью.
Отображаемая системная память меньше установленной физической памяти
Несколько модулей памяти в канале определены как неисправные
В регионе с чередованием отображается дополнительное пространство имен
Модули PMEM установлены в неправильные гнезда после замены материнской платы
Невозможно успешно создать цель при установке модулей PMEM в систему в первый раз
Отображаемая системная память меньше установленной физической памяти
Выполните следующие действия, чтобы решить проблему.
- Убедитесь в выполнении указанных ниже условий.
На информационной панели оператора не горят никакие индикаторы ошибок.
На материнской плате не горят никакие индикаторы ошибок модуля памяти.
Зеркальный канал памяти не учитывает несоответствие.
Модули памяти установлены правильно.
Установлен модуль памяти правильного типа (см. требования в разделе Правила PMEM).
После замены модуля памяти конфигурация памяти обновляется соответствующим образом в Setup Utility.
Включены все банки памяти. При обнаружении неполадки сервер, возможно, автоматически отключил банк памяти или банк памяти мог быть отключен вручную.
При минимальной конфигурации памяти сервера не существует несоответствия памяти.
Если установлены модули PMEM:
См. раздел Правила PMEM, чтобы проверить, что отображаемая память соответствует описанию режима.
Если задан режим памяти App Direct, создается резервная копия всех сохраненных данных и перед заменой или добавлением любого модуля PMEM созданные пространства имен удаляются.
Если модули PMEM недавно переведены в режим памяти, переключитесь назад на режим App Direct и проверьте, существует ли неудаленное пространство имен.
Перейдите в Setup Utility, выберите
и убедитесь, что безопасность всех модулей PMEM отключена.
Извлеките и снова установите модули памяти, а затем перезапустите сервер.
Проверьте журнал ошибок POST:
Если модуль памяти был отключен прерыванием управления системой (SMI), замените его.
Если модуль памяти был отключен пользователем или тестом POST, извлеките и снова вставьте его, а затем запустите программу Setup Utility и включите модуль памяти.
Запустите диагностику памяти. Если запустить решение и нажать клавишу F1, интерфейс LXPM отображается по умолчанию. (Дополнительные сведения см. в разделе «Запуск» в документации к LXPM, соответствующей вашему серверу, по адресу Страница портала Lenovo XClarity Provisioning Manager.) Диагностику памяти можно выполнить из этого интерфейса. На странице «Диагностика» выберите или Тест PMEM.
Прим.Если установлены модули PMEM, выполните диагностику на основании режима, заданного в данный момент.Режим App Direct:
Запустите тест памяти для модулей памяти DRAM.
Запустите тест PMEM для модулей PMEM.
Режим памяти:
Запустите тест памяти и тест PMEM для модулей PMEM.
- Переставьте в обратном порядке модули между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.Прим.Если установлены модули PMEM, используйте этот способ только в режиме памяти.
Реактивируйте все модули памяти с помощью программы Setup Utility и перезапустите сервер.
(Только для квалифицированных специалистов). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.
(Только для квалифицированных специалистов). Замените материнскую плату.
Несколько модулей памяти в канале определены как неисправные
Выполните следующие действия, чтобы решить проблему.
- Установите модули памяти, а затем перезапустите сервер.
- Извлеките модуль памяти с наибольшим номером среди определенных как неисправные и замените его идентичным исправным модулем памяти. Затем перезапустите сервер. При необходимости повторите эту операцию. Если после замены всех модулей памяти, определенных как неисправные, сбои продолжаются, перейдите к шагу 4.
- Установите обратно извлеченные модули памяти (по очереди) в исходные разъемы, перезапуская сервер после установки каждого модуля памяти, пока не обнаружите неисправный модуль. Замените все неисправные модули памяти идентичными исправными модулями, перезапуская сервер после замены каждого модуля памяти. Повторяйте шаг 3, пока не проверите все извлеченные модули памяти.
- Замените модуль памяти с наибольшим номером среди определенных как неисправные и перезапустите сервер. При необходимости повторите эту операцию.
- Переставьте в обратном порядке модули памяти между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.
- (Только для квалифицированных специалистов по техническому обслуживанию). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.
- (Только для квалифицированных специалистов по техническому обслуживанию) Замените материнскую плату.
Попытка перейти на другой режим PMEM завершилась с ошибкой
Если после изменения режима PMEM и перезапуска системы режим PMEM не меняется, проверьте емкость модулей DIMM DRAM и PMEM, чтобы определить, соответствует ли она требованиям нового режима (см. раздел Правила PMEM).
В регионе с чередованием отображается дополнительное пространство имен
Если в одном регионе с чередованием существует два пространства имен, VMware ESXi игнорирует созданные пространства имен и создает дополнительное новое пространство имен при загрузке системы. Удалите созданные пространства имен в Setup Utility или операционной системе перед первой загрузкой с помощью ESXi.
Перенесенные модули PMEM не поддерживаются
- Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
- Переместите модули обратно в исходную систему с точно такой же конфигурацией, как и ранее.
- Создайте резервную копию сохраненных данных в пространствах имен PMEM.
- Отключите безопасность PMEM одним из следующих способов:
LXPM
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.Setup Utility
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.
- Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
Команда Linux:
ndctl destroy-namespace all -f
Команда Windows Powershell:
Get-PmemDisk | Remove-PmemDisk
- Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).
ipmctl delete -pcd
Прим.Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам: Запустите сервер и нажмите клавишу, указанную в инструкциях на экране. (Дополнительные сведения см. в разделе «Запуск» в документации к LXPM, соответствующей вашему серверу, по адресу Страница портала Lenovo XClarity Provisioning Manager.) Отобразится интерфейс Lenovo XClarity Provisioning Manager по умолчанию.
- Выключите систему.
- Удалите модули, которые необходимо использовать повторно для новой системы или конфигурации.
Обнаружено неправильное заполнение памяти
- Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
- Чтобы убедиться, что текущая последовательность установки модулей памяти поддерживается, см. раздел Правила и порядок установки модулей памяти.
- Если текущая последовательность поддерживается, проверьте, отображается ли для каких-либо модулей статус «отключено» в Setup Utility.
- Переустановите модуль со статусом «отключено» и перезагрузите систему.
- Если неполадка сохраняется, замените модуль памяти.
Модули PMEM установлены в неправильные гнезда после замены материнской платы
- DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
- Запишите каждую из инструкций изменения гнезда PMEM из событий XCC.
- Отключите системы и извлеките модули PMEM, упомянутые в предупреждениях. Рекомендуется пометить эти модули PMEM, чтобы избежать путаницы.
- Установите модули PMEM в гнезда с правильными номерами, указанными в предупреждениях. Снимите метки, чтобы они не мешали воздушному потоку и охлаждению.
- Завершите замену и включите систему. Убедитесь, что в XCC нет аналогичных предупреждений.
После перенастройки модулей PMEM сообщения об ошибках и светодиодные индикаторы продолжают сообщать, что модули PMEM установлены в неправильные гнезда
Чтобы устранить эту проблему, выключите и включите систему или перезапустите XCC.
Невозможно успешно создать цель при установке модулей PMEM в систему в первый раз
- ОШИБКА: невозможно получить сведения о ресурсах памяти
- ОШИБКА: один или несколько модулей PMEM не имеют данных PCD. Для восстановления допустимых данных PCD рекомендуется выполнить перезагрузку платформы.
- Если модули PMEM были установлены в другой системе с сохраненными данными, выполните указанные ниже действия, чтобы удалить данные.
- На основе исходного порядка заполнения установите модули PMEM в исходную систему, где они были установлены ранее, и создайте резервную копию данных из модулей PMEM на других устройствах хранения данных.
- Отключите безопасность PMEM одним из следующих способов:
LXPM
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.Setup Utility
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.
- Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
Команда Linux:
ndctl destroy-namespace all -f
Команда Windows Powershell:
Get-PmemDisk | Remove-PmemDisk
- Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).
ipmctl delete -pcd
Прим.Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам:
- Установите модули PMEM обратно в целевую систему и обновите микропрограмму системы до последней версии без входа в программу Setup Utility.
Если проблема сохраняется, перезапишите модули PMEM с помощью следующей команды ndctl.
ndctl sanitize-dimm --overwrite all
Отслеживайте состояние перезаписи с помощью следующей команды.
watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
- Когда все модули PMEM получат статус OverwriteStatus=Completed, перезагрузите систему и проверьте, сохранилась ли проблема.