Aller au contenu principal

Problèmes observables

Ces informations permettent de résoudre les problèmes observables.

Le serveur s’interrompt pendant le processus d’amorçage UEFI

Si le système s’interrompt lors du processus d’amorçage UEFI et affiche le message UEFI: DXE INIT à l’écran, vérifiez que la mémoire ROM en option n’a été pas configurée sur Hérité. Vous pouvez afficher à distance les paramètres actuels de la mémoire ROM en option en exécutant la commande suivante à l'aide du Lenovo XClarity Essentials OneCLI :

onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress

Pour effectuer la récupération d'un système bloqué pendant le processus d'amorçage dont la mémoire ROM en option est définie sur le paramètre Hérité, reportez-vous à l'astuce technique suivante :

Le serveur ThinkSystem se bloque pendant l'amorçage UEFI avec « UEFI:DXE INIT » lorsque les paramètres de la mémoire ROM en option sont configurés sur Hérité

Si la mémoire ROM en option héritée doit être utilisée, ne configurez pas son emplacement sur Hérité dans les menus Périphériques et ports d'E-S. Au lieu de cela, définissez l'emplacement de la mémoire ROM en option sur Automatique (configuration par défaut) et définissez le Mode d'amorçage système sur Mode hérité. La mémoire ROM en option héritée sera appelée peu de temps avant le démarrage du système.

Le serveur affiche immédiatement l'observateur d'événements d'autotest à la mise sous tension lorsqu'il est activé

Procédez comme suit jusqu’à ce que le problème soit résolu.
  1. Résolvez les erreurs indiquées par l’affichage des voyants et des diagnostics du système.

  2. Assurez-vous que le serveur prend en charge tous les processeurs et que ces derniers correspondent en termes de vitesse et de taille du cache.

    Vous pouvez consulter les détails de processeur depuis la configuration du système.

    Pour déterminer si le processeur est pris en charge par le serveur, voir Site Web Lenovo ServerProven.

  3. (Techniciens qualifiés uniquement) Vérifiez que le processeur est correctement installé.

  4. Remplacez les composants suivants l’un après l'autre, dans l'ordre indiqué et redémarrez le serveur systématiquement :

    1. (Technicien qualifié uniquement) Processeur

    2. (Technicien qualifié uniquement) Carte mère (bloc carte mère)

Le serveur ne répond pas (le test POST est terminé et le système d'exploitation est en cours d'exécution)

Procédez comme suit jusqu’à ce que le problème soit résolu.
  • Si vous êtes au même emplacement que le nœud de traitement, procédez comme suit :

    1. Si vous utilisez une connexion KVM, assurez-vous que la connexion fonctionne correctement. Sinon, vérifiez que le clavier et la souris fonctionnent correctement.

    2. Si possible, connectez-vous au nœud de traitement et vérifiez que toutes les applications sont en cours d'exécution (aucune application n'est bloquée).

    3. Redémarrez le nœud de traitement.

    4. Si le problème persiste, vérifiez que les nouveaux logiciels ont été installés et configurés correctement.

    5. Contactez le revendeur ou le fournisseur du logiciel.

  • Si vous accédez au nœud de traitement à partir d'un emplacement distant, procédez comme suit :

    1. Vérifiez que toutes les applications sont en cours d'exécution (aucune application n'est bloquée).

    2. Tentez de vous déconnecter du système, puis de vous connecter à nouveau.

    3. Validez l'accès réseau en exécutant la commande ping ou en exécutant une route de trace vers le nœud de traitement à partir d'une ligne de commande.

      1. Si vous ne parvenez pas à obtenir de réponse lors d'un test ping, tentez d'exécuter la commande ping pour un autre nœud de traitement du boîtier afin de déterminer s'il existe un problème de connexion ou un problème de nœud de traitement.

      2. Exécutez une route de trace pour déterminer si la connexion s'est interrompue. Tentez de résoudre un problème de connexion lié au réseau privé virtuel ou au point d'interruption de la connexion.

    4. Redémarrez le nœud de traitement à distance via l'interface de gestion.

    5. Si le problème persiste, vérifiez que les nouveaux logiciels ont été installés et configurés correctement.

    6. Contactez le revendeur ou le fournisseur du logiciel.

Le serveur n'est pas réactif (échec du POST et impossible de démarrer la configuration du système)

Les modifications de la configuration, telles que l’ajout d’unités ou les mises à jour du microprogramme de l’adaptateur, ainsi que les problèmes liés au microprogramme ou au code de l’application, peuvent provoquer l’échec de l’autotest à la mise sous tension (POST).

Dans ce cas, le serveur répond de l'une des manières suivantes :
  • Le serveur redémarre automatiquement et essaye à nouveau un autotest à la mise sous tension.

  • Le serveur se bloque et vous devez le redémarrer manuellement afin qu'il tente à nouveau un autotest à la mise sous tension.

Après un nombre défini de tentatives consécutives (automatiques ou manuelles), le serveur rétablit la configuration UEFI par défaut et démarre la configuration système pour que vous puissiez effectuer les corrections nécessaires et redémarrer le serveur. Si le serveur ne parvient pas à terminer l’autotest à la mise sous tension avec la configuration par défaut, alors il est possible que la carte mère (bloc carte mère) présente un problème. Vous pouvez indiquer le nombre de tentatives consécutives de redémarrage dans la configuration du système. Cliquez sur Paramètres système > Récupération > Tentatives POST > Seuil de tentatives POST. Les options disponibles sont 3, 6, 9 et 255.

Le détecteur de panne de tension est affiché dans le journal des événements

Procédez comme suit jusqu’à ce que le problème soit résolu.
  1. Ramenez le système à la configuration minimale. Voir Spécifications techniques du nœud pour le nombre de processeurs et de barrettes DIMM minimum requis.

  2. Redémarrez le système.

    • Si le système redémarre, ajoutez chacun des éléments que vous avez retiré un par un, et redémarrez le serveur à chaque fois, jusqu’à ce que l’erreur se produise. Remplacez l'élément pour lequel l'erreur se produit.
    • Si le système ne redémarre pas, il se peut que la carte mère (bloc carte mère) présente un problème.

Odeur inhabituelle

Procédez comme suit jusqu’à ce que le problème soit résolu.

  1. Une odeur inhabituelle peut provenir d'un nouveau matériel installé.
  2. Si le problème persiste, prenez contact avec le support Lenovo.

Le serveur semble être en surchauffe

Procédez comme suit jusqu'à ce que le problème soit résolu.

Lorsqu'il existe plusieurs châssis ou nœuds de traitement :

  1. Vérifiez que la température ambiante est dans la plage définie (voir Gestion de la température ambiante).
  2. Vérifiez que les ventilateurs sont installés correctement.

  3. Mettez à jour le microprogramme UEFI et XCC vers les versions les plus récentes.

  4. Assurez-vous que les obturateurs du serveur sont correctement installés (voir Procédures de remplacement de matériel pour obtenir des procédures d’installation détaillées).

  5. Utilisez la commande IPMI pour augmenter la vitesse du ventilateur jusqu’à atteindre la vitesse maximale afin de déterminer si le problème peut être résolu.

    Remarque
    La commande raw IPMI ne doit être utilisée que par un technicien qualifié et chaque système possède sa propre commande raw IPMI spécifique.
  6. Parcourez le journal des événements du processeur de gestion pour savoir si des événements de hausse de température ont été consignés. S’il n’y a aucun événement, le nœud de traitement s’exécute avec des températures de fonctionnement normales. Il peut exister quelques variations de température.

Impossible d’entrer en mode hérité après l’installation d’un nouvel adaptateur

Pour résoudre ce problème, procédez comme suit.

  1. Accédez à Configurer UEFI > Périphériques et ports d’E-S > Définir l’ordre d’exécution de la mémoire Option ROM.
  2. Déplacez l’adaptateur RAID avec le système d’exploitation installé vers le haut de la liste.
  3. Sélectionnez Enregistrer.
  4. Redémarrez le système et réamorcez automatiquement le système d’exploitation.

Éléments fissurés ou châssis fissuré

Contactez le support Lenovo.