Installation du complexe GPU H100/H200
Suivez les instructions de la présente section pour installer le complexe GPU H100/H200. La procédure doit être exécutée par un technicien qualifié.
À propos de cette tâche
S036
![]() | ![]() |
18 - 32 kg (39 - 70 lb) | 32 – 55 kg (70 – 121 lb) |
ATTENTION
Soulevez la machine avec précaution.
Avertissement
- Lisez Conseils d’installation et Liste de contrôle d’inspection de sécurité pour vous assurer que vous travaillez en toute sécurité.
- Mettez l’emballage antistatique contenant le composant contre une zone métallique non peinte du serveur, puis déballez et posez le composant sur une surface de protection antistatique.
Remarque
Assurez-vous de disposer des outils requis répertoriés ci-dessous afin de pouvoir remplacer correctement le composant :
- Tournevis T10 Torx
- Tournevis à tête T15 Torx
- Tournevis cruciforme n°1
- Tournevis cruciforme n°2
- Tournevis à tête plate
- Tampon de nettoyage à l’alcool
- 2 kits PCM H100/H200
- 2 kits de tampons de mastic de la boucle d’eau H100/H200 SR780a V3
- Kit de maintenance de la boucle d’eau H100/H200 SR780a V3
- Kit de dispositif de maintenance GPU H100/H200
- Kit PCM NVSwitch H100/H200
- Kit de tampons de mastic NVSwitch H100/H200
- Kit de poignée de carte mère du GPU H100/H200
- Rallonge Torx T25 150 mm (pour les poignées de carte mère du GPU)
Remarque
Assurez-vous de disposer des outils requis répertoriés ci-dessous afin de pouvoir remplacer correctement le composant :
- Tournevis dynamométrique qui peut être défini sur 0,6 newton-mètre, 5,3 pouces-livres
Téléchargement du microprogramme et des pilotes : une fois un composant remplacé, il est possible que la mise à jour du microprogramme ou des pilotes soit requise.
Accédez à Site Web de téléchargement des pilotes et logiciels pour ThinkSystem SR780a V3 pour consulter les dernières mises à jour de microprogramme et de pilote disponibles pour votre serveur.
Reportez-vous à Mise à jour du microprogramme pour en savoir plus sur les outils de mise à jour du microprogramme.
L’illustration suivante présente la numérotation GPU et la numérotation des emplacements associés dans le XCC.
Figure 1. Numérotation GPU


Socket GPU physique | Numérotation des emplacements dans XCC | Numéro logique dans nvidia-smi |
---|---|---|
GPU 1 | Emplacement 21 | 1 |
GPU 2 | Emplacement 24 | 2 |
GPU 3 | Emplacement 22 | 0 |
GPU 4 | Emplacement 23 | 3 |
GPU 5 | Emplacement 17 | 5 |
GPU 6 | Emplacement 20 | 6 |
GPU 7 | Emplacement 18 | 4 |
GPU 8 | Emplacement 19 | 7 |
Procédure
Après avoir terminé
- Réinstallez le module de plaque froide NVswitch. Voir Installation du module de plaque froide NVswitch H100/H200.
- Réinstallez le module de plaque froide GPU H100/H200 avant. Voir Installation du module de plaque froide GPU H100/H200 avant.
- Réinstallez le module de plaque froide GPU H100/H200 arrière. Voir Installation du module de plaque froide GPU H100/H200 arrière.
- Rebranchez les câbles sur le Carte mère du GPU. Consultez Cheminement des câbles de la carte mère du GPU pour en savoir plus.
- Reconnectez tous les câbles débranchés précédemment. Voir Cheminement interne des câbles.
- Réinstallez le complexe d’alimentation. Voir Installation du complexe d’alimentation.
- Réinstallez le complexe UC. Voir Installation du complexe UC.
- Réinstallez le boîtier de ventilation. Voir Installation du boîtier de ventilation (technicien qualifié uniquement).
- Réinstallez le carter supérieur arrière. Voir Installation du carter supérieur arrière.
- Réinstallez le carter supérieur avant. Voir Installation du carter supérieur avant.
- Terminez de remplacer les composants. Voir Fin du remplacement des composants.
Envoyer des commentaires