Problemi relativi al vassoio per switch NVLink
Usare queste informazioni per risolvere i problemi relativi al vassoio per switch NVLink.
Per altre informazioni sull'interfaccia SMI (System Management Interface), vedere Interfaccia di gestione del sistema NVIDIA.
nv show system health
Eseguire il comando nv show system health per visualizzare lo stato di integrità del vassoio per switch NVLink.
Figura 1. nv show system health
nv show cluster apps running
Eseguire il comando nv show cluster apps running per visualizzare tutte le applicazioni cluster attive attualmente in esecuzione nel cluster NVOS.
Figura 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
Eseguire il comando nvidia-smi-q | grep -A4 Fabric per visualizzare lo stato di connessione del cluster.
Figura 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
Eseguire il comando nvidia-smi topo –p2p n per visualizzare lo stato della topologia di connessione della GPU.
Figura 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
Eseguire il comando nvidia-smi nvlink -s per visualizzare lo stato della connessione NVLink.
Figura 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
Eseguire il comando nvidia-smi-q | grep Platform -A 6 per visualizzare lo stato di connessione fabric del vassoio di elaborazione.
Figura 6. nvidia-smi-q | grep Platform -A 6