Problèmes liés au plateau du commutateur NVLink
Les informations de la présente section vous permettent de résoudre les problèmes relatifs au plateau du commutateur NVLink.
Pour en savoir plus sur l’interface de gestion du système (SMI), voir Interface de gestion de système NVIDIA.
nv show system health
Exécutez la commande nv show system health afin d’afficher l’état d’intégrité du plateau du commutateur NVLink.
Figure 1. nv show system health
nv show cluster apps running
Exécutez la commande nv show cluster apps running afin d’afficher toutes les applications du cluster NVOS actuellement en cours d’exécution.
Figure 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
Exécutez la commande nvidia-smi-q | grep -A4 Fabric afin d’afficher le statut de connexion du cluster.
Figure 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
Exécutez la commande nvidia-smi topo –p2p n afin d’afficher le statut de la topologie de connexion GPU.
Figure 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
Exécutez la commande nvidia-smi nvlink -s afin d’afficher le statut de la connexion NVLink.
Figure 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
Exécutez la commande nvidia-smi-q | grep Platform -A 6 afin d’afficher le statut de la connexion du réseau des plateaux de calcul.
Figure 6. nvidia-smi-q | grep Platform -A 6