Неполадки с памятью
В этом разделе представлены сведения по устранению неполадок, связанных с памятью.
Распространенные неполадки с памятью
Неполадки, связанные с модулями PMEM
Несколько рядов модулей памяти в канале определены как неисправные
Выполните следующие действия, чтобы решить проблему.
- Установите модули памяти, а затем перезапустите сервер.
- Извлеките модуль памяти с наибольшим номером среди определенных как неисправные и замените его идентичным исправным модулем памяти. Затем перезапустите сервер. При необходимости повторите эту операцию. Если после замены всех модулей памяти, определенных как неисправные, сбои продолжаются, перейдите к шагу 4.
- Установите обратно извлеченные модули памяти (по очереди) в исходные разъемы, перезапуская сервер после установки каждого модуля памяти, пока не обнаружите неисправный модуль. Замените все неисправные модули памяти идентичными исправными модулями, перезапуская сервер после замены каждого модуля памяти. Повторяйте шаг 3, пока не проверите все извлеченные модули памяти.
- Замените модуль памяти с наибольшим номером среди определенных как неисправные и перезапустите сервер. При необходимости повторите эту операцию.
- Переставьте в обратном порядке модули памяти между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.
- (Только для квалифицированных специалистов). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.
- (Только для квалифицированных специалистов). Замените материнскую плату.
Отображаемая системная память меньше установленной физической памяти
Выполните следующие действия, чтобы решить проблему.
- Убедитесь в выполнении указанных ниже условий.
На информационной панели оператора не горят никакие индикаторы ошибок.
На материнской плате не горят никакие индикаторы ошибок модуля памяти.
Зеркальный канал памяти не учитывает несоответствие.
Модули памяти установлены правильно.
У вас установлен модуль памяти правильного типа (см. Правила PMEM требования).
После замены модуля памяти конфигурация памяти обновляется соответствующим образом в Setup Utility.
Включены все банки памяти. При обнаружении неполадки сервер, возможно, автоматически отключил банк памяти или банк памяти мог быть отключен вручную.
При минимальной конфигурации памяти сервера не существует несоответствия памяти.
Если установлены модули PMEM:
Если задан режим памяти App Direct, создается резервная копия всех сохраненных данных и перед заменой или добавлением любого модуля PMEM созданные пространства имен удаляются.
См. требования в Правила PMEM, а также убедитесь, что отображаемая память соответствует описанию режима.
Если модули PMEM недавно переведены в режим памяти, переключитесь назад на режим App Direct и проверьте, существует ли неудаленное пространство имен.
Перейдите в Setup Utility, выберите
и убедитесь, что безопасность всех модулей PMEM отключена.
Извлеките и снова установите модули памяти, а затем перезапустите сервер.
Проверьте журнал ошибок POST:
Если модуль памяти был отключен прерыванием управления системой (SMI), замените его.
Если модуль памяти был отключен пользователем или тестом POST, извлеките и снова вставьте его, а затем запустите программу Setup Utility и включите модуль памяти.
Запустите диагностику памяти. При запуске решения и нажатии клавиши в соответствии с инструкциями на экране по умолчанию отображается интерфейс LXPM. (Дополнительные сведения см. в разделе «Запуск» документации к LXPM, совместимой с вашим сервером, по адресу Страница портала Lenovo XClarity Provisioning Manager.) Диагностику памяти можно выполнить из этого интерфейса. На странице «Диагностика» выберите или Тест PMEM.
Прим.Если установлены модули PMEM, выполните диагностику на основании режима, заданного в данный момент.Режим App Direct:
Запустите тест памяти для модулей памяти DRAM.
Запустите тест PMEM для модулей PMEM.
Режим памяти:
Запустите тест памяти и тест PMEM для модулей PMEM.
- Переставьте в обратном порядке модули между каналами (одного процессора) и перезапустите сервер. Если неполадка связана с каким-либо модулем памяти, замените неисправный модуль памяти.Прим.Если установлены модули PMEM, используйте этот способ только в режиме памяти.
Реактивируйте все модули памяти с помощью программы Setup Utility и перезапустите сервер.
(Только для квалифицированных специалистов). Установите неисправный модуль памяти в разъем модуля памяти процессора 2 (если он установлен), чтобы выяснить, не связана ли неполадка с процессором или разъемом модуля памяти.
(Только для квалифицированных специалистов). Замените материнскую плату.
Обнаружено неправильное заполнение памяти
- Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
- См. Правила и порядок установки модулей памяти и убедитесь, что поддерживается последовательность заполнения текущих модулей памяти.
- Если текущая последовательность поддерживается, проверьте, отображается ли для каких-либо модулей статус «отключено» в Setup Utility.
- Переустановите модуль со статусом «отключено» и перезагрузите систему.
- Если неполадка сохраняется, замените модуль памяти.
Попытка перейти на другой режим PMEM завершилась с ошибкой
Если после изменения режима PMEM и перезапуска системы режим PMEM не изменяется, проверьте модули DRAM DIMM и объем PMEM и убедитесь, что он соответствует требованию нового режима (см. требования в разделе Правила PMEM).
В регионе с чередованием отображается дополнительное пространство имен
Если в одном регионе с чередованием существует два пространства имен, VMware ESXi игнорирует созданные пространства имен и создает дополнительное новое пространство имен при загрузке системы. Удалите созданные пространства имен в Setup Utility или операционной системе перед первой загрузкой с помощью ESXi.
Перенесенные модули PMEM не поддерживаются
- Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
- Переместите модули обратно в исходную систему с точно такой же конфигурацией, как и ранее.
- Создайте резервную копию сохраненных данных в пространствах имен PMEM.
- Отключите безопасность PMEM одним из следующих способов:
LXPM
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.Setup Utility
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.
- Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
Команда Linux:
ndctl destroy-namespace all -f
Команда Windows Powershell:
Get-PmemDisk | Remove-PmemDisk
- Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).
ipmctl delete -pcd
Прим.Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам: - Перезагрузите систему и нажмите клавишу в соответствии с инструкциями на экране, чтобы войти в программу Setup Utility. (Дополнительные сведения см. в разделе «Запуск» документации к LXPM, совместимой с вашим сервером, по адресу Страница портала Lenovo XClarity Provisioning Manager.)
- Выключите систему.
- Удалите модули, которые необходимо использовать повторно для новой системы или конфигурации.
Модули PMEM установлены в неправильные гнезда после замены материнской платы
- DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
- Запишите каждую из инструкций изменения гнезда PMEM из событий XCC.
- Отключите системы и извлеките модули PMEM, упомянутые в предупреждениях. Рекомендуется пометить эти модули PMEM, чтобы избежать путаницы.
- Установите модули PMEM в гнезда с правильными номерами, указанными в предупреждениях. Снимите метки, чтобы они не мешали воздушному потоку и охлаждению.
- Завершите замену и включите систему. Убедитесь, что в XCC нет аналогичных предупреждений.
После перенастройки модулей PMEM сообщения об ошибках и светодиодные индикаторы продолжают сообщать, что модули PMEM установлены в неправильные гнезда
Чтобы устранить эту проблему, выключите и включите систему или перезапустите XCC.
Невозможно успешно создать цель при установке модулей PMEM в систему в первый раз
- ОШИБКА: невозможно получить сведения о ресурсах памяти
- ОШИБКА: один или несколько модулей PMEM не имеют данных PCD. Для восстановления допустимых данных PCD рекомендуется выполнить перезагрузку платформы.
- Если модули PMEM были установлены в другой системе с сохраненными данными, выполните указанные ниже действия, чтобы удалить данные.
- На основе исходного порядка заполнения установите модули PMEM в исходную систему, где они были установлены ранее, и создайте резервную копию данных из модулей PMEM на других устройствах хранения данных.
- Отключите безопасность PMEM одним из следующих способов:
LXPM
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.Setup Utility
Выберите команду
и введите парольную фразу, чтобы отключить безопасность.
- Удалите пространства имен с помощью команды, соответствующей установленной операционной системе.
Команда Linux:
ndctl destroy-namespace all -f
Команда Windows Powershell:
Get-PmemDisk | Remove-PmemDisk
- Очистите данные конфигурации платформы (PCD) и область хранилища меток пространств имен (LSA) с помощью следующей команды ipmctl (для Linux и Windows).
ipmctl delete -pcd
Прим.Чтобы узнать, как загрузить и использовать ipmctl в различных операционных системах, перейдите по следующим ссылкам:
- Установите модули PMEM обратно в целевую систему и обновите микропрограмму системы до последней версии без входа в программу Setup Utility.
Если проблема сохраняется, перезапишите модули PMEM с помощью следующей команды ndctl.
ndctl sanitize-dimm --overwrite all
Отслеживайте состояние перезаписи с помощью следующей команды.
watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
- Когда все модули PMEM получат статус OverwriteStatus=Completed, перезагрузите систему и проверьте, сохранилась ли проблема.