Aller au contenu principal

Retrait d’un module dissipateur thermique et GPU H100/H200

Suivez les instructions de la présente section pour retirer un module dissipateur thermique et GPU H100/H200. La procédure doit être exécutée par un technicien qualifié.

À propos de cette tâche

Avertissement
  • Lisez Conseils d’installation et Liste de contrôle d’inspection de sécurité pour vous assurer que vous travaillez en toute sécurité.
  • Mettez le serveur et tous les dispositifs périphériques hors tension, puis déconnectez les cordons d’alimentation et tous les câbles externes. Voir Mise hors tension du serveur.
  • Deux personnes et un dispositif de levage sur site pouvant soulever jusqu’à 181 kg (400 lb) sont nécessaires pour mener à bien cette procédure. Si vous ne disposez pas de dispositif de levage, Lenovo vous propose le Genie Lift GL-8 material lift, qui peut être acheté à l’adresse suivante : Data Center Solution Configurator. Assurez-vous d’inclure la pédale de frein et la plateforme de chargement lorsque vous commandez le Genie Lift GL-8 material lift.
  • Assurez-vous d’inspecter les connecteurs et les sockets du GPU et de la Carte mère du GPU. N’utilisez pas l’unité GPU ou la Carte mère du GPU si ses connecteurs sont endommagés ou manquants, ou si des débris se trouvent dans les sockets. Remplacez le GPU ou la Carte mère du GPU par un nouveau composant avant de poursuivre la procédure d’installation.
  • Le GPU et le dissipateur thermique font partie du même composant. Ne séparez pas le dissipateur thermique du GPU.
  • Le tableau suivant présente les informations de mappage sur les sockets physiques GPU, la numérotation des emplacements dans XCC et les ID de module dans nvidia-smi.


    Socket GPU physiqueNumérotation des emplacements dans XCCID de module dans nvidia-smi
    SXM 1Emplacement 211
    SXM 2Emplacement 242
    SXM 3Emplacement 223
    SXM 4Emplacement 234
    SXM 5Emplacement 175
    SXM 6Emplacement 206
    SXM 7Emplacement 187
    SXM 8Emplacement 198
Remarque
Assurez-vous de disposer des outils requis répertoriés ci-dessous afin de pouvoir remplacer correctement le composant :
  • Tournevis dynamométrique qui peut être défini sur 0,6 newton-mètre, 5,3 pouces-livres
  • Embout allongé Torx T15 (200 mm de long)
  • Gabarit H100/H200

Procédure

  1. Préparez-vous à cette tâche.
    1. Retirez tous les blocs d’alimentation. Voir Retrait d'un bloc d'alimentation remplaçable à chaud.
    2. Retirez tous les ventilateurs avant. Voir Retrait d’un ventilateur remplaçable à chaud (avant et arrière).
    3. Retirez l’ensemble des unités remplaçables à chaud de 2,5 pouces et des obturateurs de la baie d’unité (le cas échéant) des baies d’unité. Voir Retrait d'une unité remplaçable à chaud de 2,5 pouces.
    4. Retirez la Navette GPU 8U du châssis et placez-la sur la plateforme de levage. Voir Retrait de la navette du GPU 8U.
    5. Retirez la complexe d’alimentation. Voir Retrait du complexe d’alimentation.
    6. (Module dissipateur thermique et GPU 2, 4, 5 et 7 uniquement) Retirez le conduit de ventilation du GPU. Voir Retrait d’un conduit d’aération de GPU H100/H200.
  2. Retirez le cache en plastique du Module dissipateur thermique et GPU.
    Figure 1. Retrait du cache en plastique
    Plastic cover removal
  3. Alignez le gabarit sur le dissipateur thermique de GPU et installez-le soigneusement sur le dissipateur thermique de GPU.
    Figure 2. Installation du gabarit
    Jig installation
  4. Insérez le tournevis dynamométrique dans les trous indiqués sur le gabarit et desserrez les quatre vis Torx T15 dans l’ordre indiqué sur l’illustration ci-dessous ( > > > ).
    Remarque
    Desserrez les vis à l’aide d’un tournevis dynamométrique réglé au couple approprié. À titre de référence, le couple requis pour desserrer complètement les vis est de 0,6 newton-mètre, 5,3 pouces-livres.
    Figure 3. Retrait des vis
    Screw removal
  5. Retirez le gabarit du dissipateur thermique de GPU.
    Figure 4. Retrait du gabarit
    Jig removal
  6. Utilisez les deux mains pour soulever le module GPU et dissipateur thermique hors de la carte mère du GPU.
    Figure 5. Retrait du module GPU et dissipateur thermique
    GPU and heat sink module removal

Après avoir terminé

Si vous devez renvoyer le composant ou le périphérique en option, suivez les instructions d’emballage et utilisez les matériaux que vous avez reçus pour l’emballer.