Aller au contenu principal

Problèmes observables

Ces informations permettent de résoudre les problèmes observables.

Le serveur s’interrompt pendant le processus d’amorçage UEFI

Si le système s’interrompt lors du processus d’amorçage UEFI et affiche le message UEFI: DXE INIT à l’écran, vérifiez que la mémoire ROM en option n’a été pas configurée sur Hérité. Vous pouvez afficher à distance les paramètres actuels de la mémoire ROM en option en exécutant la commande suivante à l’aide du Lenovo XClarity Essentials OneCLI :

onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress

Pour effectuer la récupération d’un système bloqué pendant le processus d’amorçage dont la mémoire ROM en option est définie sur le paramètre Hérité, reportez-vous à l’astuce technique suivante :

Le serveur ThinkSystem se bloque pendant l’amorçage UEFI avec « UEFI:DXE INIT » lorsque les paramètres de la mémoire ROM en option sont configurés sur Hérité

Si la mémoire ROM en option héritée doit être utilisée, ne configurez pas son emplacement sur Hérité dans les menus Périphériques et Ports d’E-S. Au lieu de cela, définissez l’emplacement de la mémoire ROM en option sur Automatique (configuration par défaut) et définissez le Mode d’amorçage système sur Mode hérité . La mémoire ROM en option héritée sera appelée peu de temps avant le démarrage du système.

Le serveur affiche immédiatement l’observateur d’événements d’autotest à la mise sous tension lorsqu’il est activé

Procédez comme suit jusqu’à ce que le problème soit résolu.
  1. Résolvez les erreurs indiquées par les voyants système et l’affichage des diagnostics.

  2. Assurez-vous que le serveur prend en charge tous les processeurs et que ces derniers correspondent en termes de vitesse et de taille du cache.

    Vous pouvez consulter les détails de processeur depuis la configuration du système.

    Pour déterminer si le processeur est pris en charge par le serveur, voir Site Web Lenovo ServerProven.

  3. (Technicien qualifié uniquement) Vérifiez que le processeur 1 est correctement installé.

  4. (Technicien qualifié uniquement) Retirez le processeur 2 et redémarrez le serveur.

  5. Remplacez les composants suivants l’un après l'autre, dans l'ordre indiqué et redémarrez le serveur systématiquement :

    1. (Technicien qualifié uniquement) Processeur

    2. (Technicien qualifié uniquement) Carte mère (bloc carte mère)

Le serveur ne répond pas (le test POST est terminé et le système d’exploitation est en cours d’exécution)

Procédez comme suit jusqu'à ce que le problème soit résolu.
  • Si vous êtes au même emplacement que le serveur, procédez comme suit :

    1. Si vous utilisez une connexion KVM, assurez-vous que la connexion fonctionne correctement. Sinon, vérifiez que le clavier et la souris fonctionnent correctement.

    2. Si possible, connectez-vous au serveur et vérifiez que toutes les applications sont en cours d'exécution (aucune application n'est bloquée).

    3. Redémarrez le serveur.

    4. Si le problème persiste, vérifiez que les nouveaux logiciels ont été installés et configurés correctement.

    5. Contactez le revendeur ou le fournisseur du logiciel.

  • Si vous accédez au serveur à partir d'un emplacement distant, procédez comme suit :

    1. Vérifiez que toutes les applications sont en cours d'exécution (aucune application n'est bloquée).

    2. Tentez de vous déconnecter du système, puis de vous connecter à nouveau.

    3. Validez l'accès réseau en exécutant la commande ping ou en exécutant une route de trace vers le serveur à partir d'une ligne de commande.

      1. Si vous ne parvenez pas à obtenir de réponse lors d’un test ping, tentez d’exécuter la commande ping pour un autre serveur du châssis afin de déterminer s’il existe un problème de connexion ou un problème de serveur.

      2. Exécutez une route de trace pour déterminer si la connexion s'est interrompue. Tentez de résoudre un problème de connexion lié au réseau privé virtuel ou au point d'interruption de la connexion.

    4. Redémarrez le serveur à distance via l'interface de gestion.

    5. Si le problème persiste, vérifiez que les nouveaux logiciels ont été installés et configurés correctement.

    6. Contactez le revendeur ou le fournisseur du logiciel.

Le serveur n’est pas réactif (échec de POST et impossibilité de démarrer la configuration du système)

Les modifications de la configuration, telles que l’ajout d’unités ou les mises à jour du microprogramme de l’adaptateur, ainsi que les problèmes liés au microprogramme ou au code de l’application, peuvent provoquer l’échec de l’autotest à la mise sous tension (POST).

Dans ce cas, le serveur répond de l’une des manières suivantes :
  • Le serveur redémarre automatiquement et essaye à nouveau un autotest à la mise sous tension.

  • Le serveur se bloque et vous devez le redémarrer manuellement afin qu’il tente à nouveau un autotest à la mise sous tension.

Après un nombre défini de tentatives consécutives (automatiques ou manuelles), le serveur rétablit la configuration UEFI par défaut et démarre la configuration système pour que vous puissiez effectuer les corrections nécessaires et redémarrer le serveur. Si le serveur ne parvient pas à terminer l’autotest à la mise sous tension avec la configuration par défaut, alors il est possible que la carte du processeur ou la carte d’E-S système présente un problème. Procédez comme suit :
  1. Retirez tous les périphériques récemment ajoutés et revenez à la configuration matérielle par défaut du système.

  2. Essayez de redémarrer le système. Vérifiez s’il est possible de le démarrer avec succès avec la configuration du système.

    • Si ce n’est pas le cas, procédez comme suit :
      1. Remplacez la carte du processeur.

      2. Remplacez la carte d’E-S système.

    • Si tel est le cas, essayez de déplacer l’appareil posant potentiellement un problème vers un autre système testé (SUT).

      • Si le système SUT fonctionne normalement, alors il est possible que le problème soit provoqué par la carte du processeur ou la carte d’E-S système.

      • Si le système SUT ne fonctionne pas normalement, alors il est possible que le problème soit lié à l’appareil posant potentiellement un problème.

  3. Si tous les composants posant potentiellement un problème sont isolés, mais que le problème persiste : exécutez le système affecté selon la configuration minimale pour tenter d’obtenir plus de détails par isolation, puis ajoutez les composants un à un, étape par étape.

Le détecteur de panne de tension est affiché dans le journal des événements

Procédez comme suit jusqu’à ce que le problème soit résolu.
  1. Ramenez le système à la configuration minimale. Voir Spécifications pour le nombre de processeurs et de barrettes DIMM minimum requis.

  2. Redémarrez le système.

    • Si le système redémarre, ajoutez chacun des éléments que vous avez retiré un par un, et redémarrez le serveur à chaque fois, jusqu’à ce que l’erreur se produise. Remplacez l’élément pour lequel l’erreur se produit.

    • Si le système ne redémarre pas, préoccupez-vous tout d’abord de la carte du processeur, puis de la carte d’E-S système.

Odeur inhabituelle

Procédez comme suit jusqu’à ce que le problème soit résolu.

  1. Une odeur inhabituelle peut provenir d’un nouveau matériel installé.
  2. Si le problème persiste, prenez contact avec le support Lenovo.

Le serveur semble être en surchauffe

Procédez comme suit jusqu'à ce que le problème soit résolu.

Plusieurs serveurs ou châssis :

  1. Vérifiez que la température ambiante est dans la plage définie (voir Spécifications).
  2. Vérifiez que les ventilateurs sont installés correctement.

  3. Mettez à jour UEFI et XCC vers la version la plus récente.

  4. Assurez-vous que les obturateurs du serveur sont correctement installés (voir Procédures de remplacement de matériel pour obtenir des procédures d’installation détaillées).

  5. Utilisez la commande IPMI pour augmenter la vitesse du ventilateur jusqu’à atteindre la vitesse maximale afin de déterminer si le problème peut être résolu.

    Remarque
    La commande raw IPMI ne doit être utilisée que par un technicien qualifié et chaque système possède sa propre commande raw PMI spécifique.
  6. Parcourez le journal des événements du processeur de gestion pour savoir si des événements de hausse de température ont été consignés. S'il n'y a aucun événement, le serveur s'exécute avec des températures de fonctionnement normales. Il peut exister quelques variations de température.

Impossible d’entrer en mode hérité après l’installation d’un nouvel adaptateur

Pour résoudre ce problème, procédez comme suit.

  1. Accédez à Configurer UEFI > Périphériques et ports d’E-S > Définir l’ordre d’exécution de la mémoire Option ROM.
  2. Déplacez l’adaptateur RAID avec le système d’exploitation installé vers le haut de la liste.
  3. Sélectionnez Enregistrer.
  4. Redémarrez le système et réamorcez automatiquement le système d’exploitation.

Éléments fissurés ou châssis fissuré

Contactez le support Lenovo.