Aller au contenu principal

Problèmes liés à la mémoire

Consultez cette section pour résoudre les problèmes liés à la mémoire.

La mémoire système affichée est inférieure à la mémoire physique installée

Pour résoudre ce problème, procédez comme suit.

Remarque
Chaque fois que vous installez ou désinstallez un module de mémoire, vous devez déconnecter le serveur de la source d’alimentation. Attendez ensuite dix secondes avant de redémarrer le serveur.
  1. Vérifiez les points suivants :
    • Aucun voyant d'erreur n'est allumé sur le panneau d'information opérateur.

    • Aucun voyant d'erreur du module de mémoire n'est allumé sur la carte mère.

    • Le canal de mise en miroir de la mémoire ne tient pas compte de la différence.

    • Les modules de mémoire sont installés correctement.

    • Vous avez installé le type de module de mémoire approprié (voir la section Règles PMEM pour connaître les exigences).

    • Après la modification ou le remplacement d’un module de mémoire, la configuration de mémoire est mise à jour en fonction dans l’utilitaire Setup Utility.

    • Tous les bancs de mémoire sont activés. Il est possible que le serveur ait désactivé automatiquement un banc de mémoire lorsqu’il a détecté un problème ou un banc de mémoire peut avoir été désactivé manuellement.

    • Il n’y a pas de non concordance de mémoire en cas de configuration minimale de la mémoire.

    • Lorsque les PMEM sont installés :

      1. Consultez la section Règles PMEM et vérifiez si la mémoire affichée correspond à la description du mode.

      2. Si la mémoire est en mode App Direct, toutes les données enregistrées sont sauvegardées et les espaces de nom créés sont supprimés avant tout remplacement ou ajout de module PMEM.

      3. Si les modules PMEM sont récemment définis en mode mémoire, réactivez le mode Direct App et vérifiez si un espace de nom a été supprimé.

      4. Accédez à l’utilitaire Setup Utility, sélectionnez Configuration système et gestion de l'amorçage > PMEM Intel Optane > Sécurité, puis vérifiez que la sécurité de toutes les unités PMEM est désactivée.

  2. Réinstallez les modules de mémoire et redémarrez le serveur.

  3. Vérifiez le journal des erreurs de l'autotest à la mise sous tension :

    • Si un module de mémoire a été désactivé par une interruption de gestion de système (SMI), remplacez-le.

    • Si un module de mémoire a été désactivé par l'utilisateur ou par POST, réinstallez le module de mémoire, puis exécutez l'utilitaire Setup Utility et activez le module de mémoire.

  4. Exécutez les diagnostic mémoire. Lorsque vous démarrez une solution et appuyez sur F1, l'interface LXPM est affichée par défaut. (Pour plus d’informations, voir la section « Démarrage » dans la documentation LXPM compatible avec votre serveur à l’adresse suivante : Page du portail Lenovo XClarity Provisioning Manager.) Vous pouvez exécuter des diagnostics de mémoire avec cette interface. Depuis la page de diagnostics, accédez à Exécuter un diagnostic > Test de mémoire ou Test PMEM.

    Remarque
    Lorsque les PMEM sont installés, exécutez les diagnostics en fonction du mode actuellement défini :
    • Mode App Direct :

      • Exécutez le test mémoire pour les modules de mémoire DRAM.

      • Exécutez le test PMEM pour les PMEM.

    • Mode mémoire :

      Exécutez à la fois le test mémoire et le test PMEM pour les modules PMEM.

  5. Inversez les modules entre les canaux (du même processeur), puis redémarrez le serveur. Si le problème provient d’un module mémoire, remplacez-le.
    Remarque
    Lorsque les modules PMEM sont installés, utilisez uniquement cette méthode en mode mémoire.
  6. Activez à nouveau toutes les modules de mémoire à l'aide de Setup Utility, puis redémarrez le serveur.

  7. (Technicien qualifié uniquement) Installez le module de mémoire défectueux dans un connecteur de module de mémoire du processeur 2 (s'il est installé) afin de vérifier que le problème ne provient pas du processeur ou du connecteur de module de mémoire.

  8. (Technicien qualifié uniquement) Remplacez la carte mère.

Les différents modules de mémoire d'un canal sont identifiés comme défectueux

Remarque
Chaque fois que vous installez ou désinstallez un module de mémoire, vous devez déconnecter le serveur de la source d’alimentation. Attendez ensuite dix secondes avant de redémarrer le serveur.

Pour résoudre ce problème, procédez comme suit.

  1. Réinstallez les modules de mémoire, puis redémarrez le serveur.
  2. Retirez le module de mémoire ayant le numéro le plus élevé parmi ceux qui ont été identifiés. Remplacez-le par un module de mémoire connu et identique. Enfin, redémarrez le serveur. Répétez l'opération si nécessaire. Si les pannes persistent malgré le remplacement de tous les modules de mémoire, passez à l’étape 4.
  3. Replacez les modules de mémoire retirés, une après l’autre, dans leur connecteur d’origine. Redémarrez le serveur après chaque réinstallation jusqu’à ce qu’un module de mémoire ne fonctionne pas. Remplacez chaque module de mémoire défectueux par un module de mémoire connu et identique. Redémarrez le serveur après chaque remplacement. Répétez l’étape 3 jusqu’à ce que vous ayez testé tous les modules de mémoire retirés.
  4. Remplacez le module de mémoire ayant le numéro le plus élevé de tous ceux identifiés, puis redémarrez le serveur. Répétez l’opération si nécessaire.
  5. Inversez les modules de mémoire entre les canaux (du même processeur), puis redémarrez le serveur. Si le problème provient d'un module mémoire, remplacez-le.
  6. (Techniciens qualifiés uniquement) Installez le module de mémoire défectueux dans un connecteur de module de mémoire du processeur 2 (s'il est installé) afin de vérifier que le problème ne provient pas du processeur ou du connecteur du module de mémoire.
  7. (Technicien qualifié uniquement) Remplacez la carte mère.

Échec de la tentative de passer à un autre mode PMEM

Après avoir modifié le mode PMEM et avoir redémarré le système, si le mode PMEM demeure inchangé, vérifiez les DRAM DIMM et la capacité PMEM pour déterminer si ces derniers respectent les exigences du nouveau mode (voir Règles PMEM).

L’espace de nom supplémentaire apparaît dans la région entrelacée

S’il existe deux espaces de nom créés dans une région entrelacée, VMware ESXi ignore les espaces de nom créés et crée un espace de nom supplémentaire pendant l’initialisation du système. Supprimez les espaces de nom créés dans Setup Utility ou dans le système d’exploitation avant le premier démarrage avec ESXi.

Les PMEM migrés ne sont pas pris en charge

Si ce message d’avertissement s’affiche, procédez comme suit :
  • Intel Optane PMEM interleave set (DIMM X) is migrated from another system (Platform ID: 0x00), these migrated PMEMs are not supported nor warranted in this system.
  1. Déplacez les modules sur le système d'origine avec exactement la même configuration que la précédente.
  2. Sauvegardez les données stockées dans les espaces de noms PMEM.
  3. Désactivez la sécurité PMEM avec l’une des options suivantes :
    • LXPM

      Accédez à Configurer UEFI > Paramètres système > PMEM Intel Optane > Sécurité > Appuyer pour désactiver la sécurité, puis entrez le mot de passe pour désactiver la sécurité.

    • Setup Utility

      Accédez à Configuration système et gestion de l'amorçage > Paramètres système > PMEM Intel Optane > Sécurité > Appuyer pour désactiver la sécurité et entrez le mot de passe pour désactiver la sécurité.

  4. Supprimez les espaces de noms avec une commande correspondant au système d’exploitation qui est installé :
    • Commande Linux :

      ndctl destroy-namespace all -f
    • Commande Windows Powershell

      Get-PmemDisk | Remove-PmemDisk
  5. Effacez les données de configuration de plateforme (PCD) et la zone de stockage d’étiquette d’espace de noms (LSA) avec la commande ipmctl suivante (pour Linux et Windows).

    ipmctl delete -pcd
    Remarque
    Consultez les liens suivants pour savoir comment télécharger et utiliser impctl dans différents systèmes d’exploitation :
  6. Démarrez le serveur et appuyez sur la touche indiquée dans les instructions à l’écran. (Pour plus de détails, consultez la section « Démarrage » de la documentation LXPM compatible avec votre serveur à l’adresse Page du portail Lenovo XClarity Provisioning Manager.) L’interface Lenovo XClarity Provisioning Manager s’affiche par défaut.

  7. Mettez le système hors tension.
  8. Retirez les modules qui doivent être réutilisés pour un nouveau système ou une nouvelle configuration.

Remplissage de la mémoire invalide détecté

Si ce message d’avertissement s’affiche, procédez comme suit :
  • Invalid memory population (unsupported DIMM population) detected. Please verify memory configuration is valid.
  1. Consultez les Règles et ordre d’installation d’un module de mémoire pour vérifier que la séquence de remplissage du module de mémoire actuel est prise en charge.
  2. Si la séquence actuelle est effectivement prise en charge, vérifiez si l’un des modules est affiché sous la forme « désactivé » dans Setup Utility.
  3. Réinstallez le module qui s’affiche en tant que « désactivé », puis redémarrez le système.
  4. Si le problème persiste, remplacez le module de mémoire.

PMEM installé dans des emplacements incorrects après le remplacement de la carte mère

Si ce message d’avertissement s’affiche, procédez comme suit :
  • DIMM X of Intel Optane PMEM persistent interleave set should be moved to DIMM Y.
  1. Consignez chacune des instructions relatives à la modification de l’emplacement PMEM des événements XCC.
  2. Mettez le système hors tension, puis retirez les PMEM mentionnés dans les messages d’avertissement. Il est recommandé d’étiqueter ces PMEM pour éviter toute confusion.
  3. Installez le PMEM dans le numéro d’emplacement approprié indiqué dans les messages d’avertissement. Retirez les étiquettes afin d’éviter de bloquer l’aération et le refroidissement.
  4. Procédez au remplacement et mettez le système sous tension. Assurez-vous qu’aucun message d’avertissement similaire ne s'affiche dans XCC.
Remarque
N’effectuez pas de distribution sur PMEM afin d’éviter la perte de données lorsque les messages sont toujours présents dans les événements XCC.

Une fois les PMEM reconfigurés, les messages et les voyants d'erreur persistent pour indiquer que les PMEM sont installés dans des emplacements incorrects

Relancez un cycle d'alimentation en courant alternatif du système ou redémarrez XCC pour résoudre ce problème.

Impossible de créer un objectif lors de l'installation de PMEM sur le système pour la première fois

Lorsque vous constatez l'un des messages suivants :
  • ERREUR : impossible d'extraire les informations de ressources mémoire
  • ERREUR : un ou plusieurs modules PMEM n'ont pas de données PCD. Il est recommandé de redémarrer la plateforme pour restaurer les données PCD valides.
Pour résoudre ce problème, procédez comme ci-après.
  1. Si les PMEM ont été installés sur un autre système avec des données stockées, procédez comme suit pour effacer les données.
    1. Selon l'ordre de remplissage d'origine, installez les PMEM sur le système d'origine où ils étaient précédemment installés, puis sauvegardez les données des PMEM sur d'autres dispositifs de stockage.
    2. Désactivez la sécurité PMEM avec l’une des options suivantes :
      • LXPM

        Accédez à Configurer UEFI > Paramètres système > PMEM Intel Optane > Sécurité > Appuyer pour désactiver la sécurité, puis entrez le mot de passe pour désactiver la sécurité.

      • Setup Utility

        Accédez à Configuration système et gestion de l'amorçage > Paramètres système > PMEM Intel Optane > Sécurité > Appuyer pour désactiver la sécurité et entrez le mot de passe pour désactiver la sécurité.

    3. Supprimez les espaces de noms avec une commande correspondant au système d’exploitation qui est installé :
      • Commande Linux :

        ndctl destroy-namespace all -f
      • Commande Windows Powershell

        Get-PmemDisk | Remove-PmemDisk
    4. Effacez les données de configuration de plateforme (PCD) et la zone de stockage d’étiquette d’espace de noms (LSA) avec la commande ipmctl suivante (pour Linux et Windows).

      ipmctl delete -pcd
      Remarque
      Consultez les liens suivants pour savoir comment télécharger et utiliser impctl dans différents systèmes d’exploitation :
  2. Réinstallez les PMEM sur le système cible, puis mettez à niveau le microprogramme du système vers la dernière version sans accéder à l'utilitaire Setup Utility.
  3. Si le problème persiste, remplacez les PMEM par la commande ndctl suivante.

    ndctl sanitize-dimm --overwrite all
  4. Surveillez l’état d’écrasement à l’aide de la commande suivante.

    watch -n 1 “ipmctl show -d OverwriteStatus -dimm”
  5. Lorsque vous voyez tous les PMEM OverwriteStatus=Completed, redémarrez le système et vérifiez si le problème persiste.