Le système génère des messages d'expiration de surveillance concernant plusieurs serveurs lame
Le journal des événements du module de gestion avancée consigne les messages d'expiration du programme de surveillance. Exécutez la procédure suivante si plusieurs serveurs lame du boîtier BladeCenter S sont concernés par ces messages.
Incident
Le journal des événements du module de gestion avancée a consigné des messages d'expiration de surveillance concernant plusieurs serveurs lame d'un boîtier BladeCenter S qui fonctionne normalement.
Identification
Pour résoudre le problème, procédez comme suit :
- Recherchez les mises à jour de microprogramme correspondant au module de gestion avancée. Consultez notamment l'historique des changements du microprogramme pour en savoir plus sur les erreurs d'expiration du programme de surveillance, puis mettez à jour le microprogramme si nécessaire.
Pour télécharger le microprogramme, rendez-vous sur le site Web de téléchargement de logiciels et de pilotes de périphérique pour IBM BladeCenter et sélectionnez BladeCenter S.
- Sur la page de support IBM, recherchez les mises à jour de microprogramme correspondant au module de gestion avancée. Consultez notamment l'historique des changements du microprogramme pour en savoir plus sur les erreurs d'expiration du programme de surveillance, puis mettez à jour le microprogramme si nécessaire.
- Vérifiez que les niveaux de code du processeur de maintenance (autrement dit le processeur de gestion intégrée de systèmes et le contrôleur de gestion de la carte mère) sont à jour et qu'il ne manque pas un correctif important.
- Vérifiez le fonctionnement des serveurs lame. S'ils répondent, il existe peut-être une condition d'erreur fausse.
- Vérifiez que le pilote IBM ASR (Automatic Server Restart) est installé sur le serveur lame.
- Mettez à jour le microprogramme du processeur de maintenance sur le serveur lame.
- Mettez à jour le microprogramme du module de gestion avancée.
- Remplacez le module de gestion avancée.
- Si tous les serveurs lame ne répondent pas et qu'ils exécutent le même niveau de système d'exploitation et des applications similaires, redémarrez plusieurs des serveurs lame et consultez les journaux générés par le système d'exploitation de chaque serveur lame.
- Regardez si les serveurs lame ne répondent pas parce qu'ils ont un problème de logiciel ou de module en commun.
- Vérifiez que les pilotes de disque et de communication sont à jour.
- Même si c'est rare, il est possible que le canal de communication RS-485 jusqu'aux serveurs lame comporte suffisamment de parasites pour bloquer les processeurs de maintenance. Regardez dans le journal des événements si le système a consigné des erreurs de communication concernant le processeur de maintenance de tous les serveurs lame. Si c'est le cas, reportez-vous à d'autres procédures d'identification et de résolution d'incidents (voir Le système a détecté des erreurs de communication au niveau du processeur de maintenance (SP COMM) d'un serveur lame).
Envoyer des commentaires