Aller au contenu principal

Problèmes de fuite d’eau (boucle d’eau GPU)

Utilisez ces informations pour résoudre les problèmes liés aux fuites d'eau.

Si de l’eau est détectée à l’extérieur du châssis, assurez-vous que les blocs d’alimentation ont été déconnectés. Si aucune trace d’eau n’est présente à l’extérieur du châssis, mais que vous soupçonnez l’existence d’une fuite d’eau à l’intérieur du châssis, procédez comme suit pour déterminer la source de la fuite. Les boucles d’eau du GPU et du CPU sont équipées de capteurs de fuite pour aider à détecter les fuites d’eau.
Remarque
Une petite fuite peut ne pas être détectée par l’un ou l’autre des capteurs de fuite, une confirmation visuelle peut donc être nécessaire.

Symptômes de fuite

Les situations suivantes peuvent se produire en raison de problèmes de fuite :
  • Erreur due à une température excessive du processeur, indiquée par le voyant d’erreur système « ! » Voyant allumé fixement à l’avant du serveur

  • Le voyant vert du détecteur de fuite reste allumé fixement lorsqu’il n’y a pas de fuite et clignote à 1 Hz si une fuite est détectée. Notez que les voyants du détecteur de fuite du GPU ne sont visibles que lorsque le système est branché sur l’alimentation secteur, tandis que le voyant du détecteur de fuite de l’UC est visible sans démonter entièrement le serveur

  • Le serveur s’est arrêté de manière inattendue

    • Si une fuite est détectée, le système coupe l’alimentation en courant continu et bloque les autorisations d’alimentation. Il ne se remet pas sous tension tant que le problème de fuite n’a pas été résolu.

    • Un câble endommagé ou pincé sur le côté « câble de fuite » du boîtier du capteur peut entraîner l’arrêt du système.

  • En cas d’erreur d’installation du détecteur de fuite, le système continue de fonctionner, car cette erreur n’est pas liée à une fuite réelle. Ce problème peut avoir les deux principales causes suivantes :

    • Un câble endommagé du côté « alimentation » du boîtier du capteur de fuite, situé entre le boîtier du capteur et le connecteur de la carte.

    • Le connecteur du câble est débranché.

  • Un événement Lenovo XClarity Controller peut signaler les événements suivants :
    • FQXSPUN0019M : Le détecteur [SensorElementName] est passé à l’état critique à partir d’un état moins grave. Cet événement indique qu’une fuite a pu être détectée.

    • FQXSPUN0038J : Le détecteur [SensorElementName] a indiqué une erreur d’installation.

  • Si le message « détection de fuite » ou « erreur d’installation du détecteur » persiste, il faut remplacer la boucle d’eau concernée

Procédez comme suit en suivant l'ordre indiqué jusqu'à pouvoir isoler la cause de la fuite potentielle :
  1. Consultez les messages Lenovo XClarity Controller pour vérifier la présence de tout avertissement concernant des fuites. Consultez le Événements XClarity Controller pour en savoir plus.

  2. Retirez le serveur de l’armoire et placez-le sur une surface de travail stable. Voir Retrait du serveur de l’armoire.

  3. Repérez la boucle d’eau du GPU indiquée par le message.

  4. Utilisez une lampe torche pour inspecter visuellement le bac d’égouttage du détecteur de fuite à la recherche d’humidité.

  5. Examinez la boucle d'eau à la recherche de toute trace d'humidité.

  6. Si vous identifiez le problème lors des étapes ci-dessus, remplacez une ou plusieurs boucles d’eau (voir Remplacement de la boucle d’eau du GPU (technicien qualifié uniquement)).
    Remarque
    Il est important d’inspecter visuellement la partie inférieure du châssis à l’aide d’une lampe torche avant de réinstaller le module de plaque froide dans le châssis.
  7. Après avoir remplacé la boucle d’eau de GPU, exécutez le cycle d’alimentation en courant alternatif et vérifiez si l’événement a été invalidé.

  8. Si vous ne parvenez pas à identifier le problème, exécutez le cycle d’alimentation en courant alternatif et vérifiez si le problème persiste. Pour plus d’informations, contactez l'ingénieur produit.