Aller au contenu principal

Retrait d’un GPU B200 avant

Suivez les instructions de la présente section pour retirer un GPU B200 avant. La procédure doit être exécutée par un technicien qualifié.

À propos de cette tâche

Avertissement
  • Lisez Conseils d’installation et Liste de contrôle d’inspection de sécurité pour vous assurer que vous travaillez en toute sécurité.
  • Mettez le serveur et tous les dispositifs périphériques hors tension, puis déconnectez les cordons d’alimentation et tous les câbles externes. Voir Mise hors tension du serveur.
  • Si le serveur est installé dans une armoire, faites sortir le serveur en le faisant glisser sur les glissières de l’armoire afin d’accéder au carter supérieur, ou retirez le châssis de l’armoire. Voir Retrait du serveur de l’armoire.
  • Deux personnes et un dispositif de levage sur site pouvant soulever jusqu’à 181 kg (400 lb) sont nécessaires pour mener à bien cette procédure. Si vous ne disposez pas de dispositif de levage, Lenovo vous propose le Genie Lift GL-8 material lift, qui peut être acheté à l’adresse suivante : Data Center Solution Configurator. Assurez-vous d’inclure la pédale de frein et la plateforme de chargement lorsque vous commandez le Genie Lift GL-8 material lift.
  • Un tournevis dynamométrique est disponible sur demande si vous n’en avez pas à portée de main.
Remarque
Assurez-vous de disposer des outils requis répertoriés ci-dessous afin de pouvoir remplacer correctement le composant :
  • Tournevis à tête T15 Torx
  • 2 rallonges Torx T15 200 mm
  • Tournevis cruciforme n°1
  • Tournevis cruciforme n°2
  • Tampon de nettoyage à l’alcool
  • PCM B200
  • B200 SXM6 PAD-1
  • B200 SXM6 PAD-2
  • Kit d’entretien GPU B200
Les kits B200 (GPU et resynchroniseur NVSwitch) (support de service et d’expédition) sont réutilisables et obligatoires lors de l’entretien des GPU et des modules de plaque froide GPU. Il est recommandé de les conserver au sein du site où le serveur fonctionne en vue d’un remplacement futur.
Important
Directives de remplacement des tampons de mastic/matériau à changement de phase (PCM)
  • Avant de remplacer le tampon de mastic ou le matériau à changement de phase, nettoyez délicatement la surface du matériel à l’aide d’un chiffon doux imbibé d’alcool.
  • Maintenez le tampon de mastic/le PCM avec précautions afin de ne pas le déformer. Assurez-vous qu’aucun trou de vis ou orifice n’est obstrué par le tampon de mastic/PCM.
  • N’utilisez pas de tampon de mastic/PCM périmé. Vérifiez la date de péremption sur l’emballage du tampon de mastic ou du PCM. Si les tampons de mastic/le PCM ont dépassé la date limite d’utilisation, achetez-en de nouveaux afin de les remplacer correctement.
L’illustration suivante présente la numérotation GPU B200 et la numérotation des emplacements associés dans XCC.
Figure 1. Numérotation GPU B200
B200 GPU numbering
Socket GPU physiqueNumérotation des emplacements dans XCCNuméro logique dans nvidia-smi

GPU 1

Emplacement 21

4

GPU 2

Emplacement 24

7

GPU 3

Emplacement 22

5

GPU 4

Emplacement 23

6

GPU 5

Emplacement 17

0

GPU 6

Emplacement 20

3

GPU 7

Emplacement 18

1

GPU 8

Emplacement 19

2

Procédure

  1. Préparez-vous à cette tâche.
    1. Retirez le carter supérieur avant. Voir Retrait du carter supérieur avant.
    2. Retirez le carter supérieur arrière. Voir Retrait du carter supérieur arrière.
    3. Retirez le boîtier de ventilation. Voir Retrait du boîtier de ventilation (technicien qualifié uniquement).
    4. Retirez le complexe UC. Voir Retrait du complexe UC.
    5. Retirez le complexe d’alimentation. Voir Retrait du complexe d’alimentation.
    6. Débranchez les câbles et retirez-les du complexe GPU si nécessaire. Avant de débrancher les câbles, dressez une liste de chaque câble et notez les connecteurs sur lesquels le câble est branché. Reportez-vous à Cheminement interne des câbles.
  2. Si le module de plaque froide GPU B200 arrière est installé, repositionnez le collecteur de la plaque froide GPU B200 arrière pour libérer de la place.
  3. Repositionnez le collecteur de la plaque froide GPU B200 arrière pour créer de l’espace pour le GPU B200 avant. Installez les deux supports de maintenance sur les plaques froides GPU arrière.
    1. Alignez les broches de guidage du support de maintenance avec les trous de guidage de la plaque froide GPU ; ensuite, abaissez-le sur la plaque froide.
    2. Serrez les deux vis imperdables (PH1, 2 M3, 0,5 newton-mètre, 4,3 pouces-livres) pour installer le support de maintenance sur la plaque froide GPU arrière. Répétez l’opération pour installer un autre support de maintenance.
      Figure 2. Installation des supports de maintenance sur les plaques froides GPU arrières
      Installing the shipping brackets to the rear GPU cold plates
      Remarque
      Évitez de pincer le câble du module de capteur de fuite lors de l’installation du support.

  4. Desserrez les quatre vis M3 (W7-W8) qui fixent le collecteur du module de plaque froide GPU B200 arrière au châssis.
    Figure 3. Retrait du collecteur du module de plaque froide GPU B200 arrière
    Removing the rear B200 GPU cold plate module manifold
  5. Repositionnez le collecteur du module de plaque froide GPU B200 arrière.
    1. Retournez le collecteur du module de plaque froide GPU B200 arrière, comme illustré. Alignez et insérez les broches de guidage du collecteur dans les emplacements de guidage des supports de transport ; ensuite, insérez le collecteur sur les supports de maintenance.
    2. Assurez-vous que les broches de guidage du collecteur sont solidement fixées dans les fentes de guidage des supports de transport.
      Figure 4. Repositionnement du collecteur du module de plaque froide GPU arrière
      Repositioning the rear B200 GPU cold plate module manifold
  6. Localisez le GPU avant.
  7. Retirez le câble du module de détecteur de fuite des clips de fixation, éloignez-le de la plaque froide et placez-le sur la plaque froide adjacente.
    Figure 5. Retrait du câble du module de détecteur de fuite
    Removing the leakage sensor module cable
  8. Desserrez les vis de 360 degrés en suivant l’ordre des vis : spécifié sur l’étiquette de la plaque froide, puis desserrez complètement les quatre vis Torx T15 à l’aide d’un tournevis dynamométrique réglé au couple approprié.
    Remarque
    • Desserrez les vis à l’aide d’un tournevis dynamométrique réglé au couple approprié. Pour référence, le couple requis pour desserrer complètement les vis est de 5,3±0,212 pouces-livres, 0,6±0,024 newton-mètre.
    • Assurez-vous que les vis imperdables sont complètement desserrées avant de retirer le module de plaque froide.
    • Assurez-vous de suivre l’ordre des vis pour éviter que la plaque froide ne s’incline.
    Figure 6. Retrait de la plaque froide GPU
    Removing the GPU cold plate
    Remarque
    • Si nécessaire, utilisez la vis du disjoncteur TIM pour séparer la plaque froide du GPU. Assurez-vous de desserrer complètement toutes les vis de la plaque froide avant de serrer la vis du disjoncteur TIM.

      • Ouvrez le couvercle de la vis du disjoncteur TIM.

      • Serrez la vis du disjoncteur TIM pour séparer la plaque froide du GPU.

    • Après utilisation, remettez la vis du disjoncteur TIM dans sa position d’origine.

      • Desserrez la vis du disjoncteur TIM pour la ramener dans sa position initiale.

      • Fermez le couvercle. S’il est impossible de fermer le couvercle, la vis du disjoncteur TIM doit être desserrée davantage.

  9. Installez le support de maintenance sur la plaque froide GPU avant. Assurez-vous que le support de maintenance est installé dans le sens illustré, avec le côté à ailettes face au collecteur.
    1. Alignez les deux vis imperdables et les broches de guidage situées au bas du support de maintenance sur les trous de vis et les trous de guidage de la plaque froide GPU ; abaissez-le ensuite sur la plaque froide.
    2. Serrez les deux vis imperdables (PH1, 2 M3, 0,5 newton-mètre, 4,3 pouces-livres) pour fixer le support de maintenance à la plaque froide GPU.
      Figure 7. Installation du support de maintenance sur la plaque froide GPU
      Installing the service bracket onto the GPU cold plate
      Remarque
      Évitez de pincer le câble du module de capteur de fuite lors de l’installation du support.

  10. Installez le support de maintenance et l’assemblage de plaque froide GPU sur le collecteur du module de plaque froide GPU B200 avant.
    1. Retournez le support de maintenance et l’assemblage de plaque froide GPU ; alignez ensuite les deux vis imperdables et les deux broches de guidage sur les trous de vis et les trous de guidage du collecteur.
      Remarque
      Assurez-vous que les tuyaux ne sont pas pliés vers l’intérieur pour éviter d’endommager les joints par contrainte.

    2. Tout d’abord, serrez la vis imperdable (PH1, 1 M3, 0,5 newton-mètre, 4,3 pouces-livres) qui se trouve sur le côté sans broches de guidage. Les emplacements des vis et des broches sont différents pour les quatre GPU avant. Dans l’illustration, le GPU 8 est utilisé à titre d’exemple. Assurez-vous de vérifier l’emplacement des vis et des broches avant de serrer la première vis.
    3. Ensuite, serrez la vis imperdable (PH1, 1 M3, 0,5 newton-mètre, 4,3 pouces-livres) qui se trouve sur le côté avec les broches de guidage.
      Figure 8. Installation du support de maintenance et de l’assemblage de plaque froide GPU
      Installing the service bracket and the GPU cold plate assembly
      Remarque
      Veillez à installer le support de maintenance et l’assemblage de plaque froide GPU dans les trous de vis et les trous de guidage correspondant au numéro d’emplacement GPU spécifique.
      Figure 9. Emplacement d’installation du support de maintenance et de l’assemblage de plaque froide GPU
      Service bracket and GPU cold plate assembly installation location
      Tableau 1. Emplacement d’installation de l’assemblage de plaque froide GPU et du support de maintenance
      Emplacement d’installationNuméro d’emplacement GPU
      1GPU 1
      2GPU 5
      3GPU 4
      4GPU 8
  11. Nettoyez immédiatement le PCM et les tampons de mastic du GPU à l’aide de tampons de nettoyage imbibés d’alcool. Nettoyez délicatement le PCM et les tampons de mastic pour éviter d’endommager le GPU.
    Avertissement
    • Il est recommandé de nettoyer le PCM lorsqu’il est à l’état liquide.

    • Les composants électriques autour de la puce des GPU sont extrêmement délicats. Lors du retrait du PCM et du nettoyage de la puce du GPU, évitez de toucher les composants électriques pour ne pas les endommager.

    Figure 10. Nettoyage du PCM et des tampons de mastic du GPU
    Cleaning PCM and putty pads off from the GPU
  12. À l’aide de tampons de nettoyage imbibés d’alcool, essuyez le restant des tampons de mastic et des PCM de la plaque froide GPU.
    Figure 11. Essuyage du PCM et des tampons de mastic de la plaque froide
    Wiping PCM and putty pads off from the cold plate
  13. Retirez le GPU. Fixez les deux rallonges Torx T15 200 mm à deux tournevis dynamométriques. Desserrez simultanément les deux vis Torx T15 diagonales à l’aide du tournevis réglé au couple approprié.
    1. Réglez le tournevis dynamométrique sur 0,6 newton-mètre, 5,3 pouces-livres pour desserrer simultanément les deux vis diagonales  ; desserrez ensuite simultanément les deux vis diagonales .
      Figure 12. Retrait du GPU
      Removing the GPU
    2. Installez les deux poignées de vis du GPU en diagonale. Alignez les poignées de vis sur les encoches de vis de la plaque froide ; fixez ensuite les poignées de vis à la main.
      Figure 13. Installation des poignées de vis du GPU
      Installing the GPU screw handles
    3. Saisissez les poignées de vis du GPU pour retirer le GPU de la carte mère du GPU.
      Figure 14. Retrait du GPU
      Removing the GPU
    4. Déposez avec précaution le GPU sur une surface de protection électrostatique plane. Retirez les deux poignées de vis en les desserrant à la main.
      Figure 15. Retrait des poignées de vis du GPU
      Removing the GPU screw handles

Après avoir terminé

  1. Installez une unité de remplacement. Voir Installation d’un GPU B200 avant.
  2. Si vous devez renvoyer le composant ou le périphérique en option, suivez les instructions d’emballage et utilisez les matériaux que vous avez reçus pour l’emballer.