Problemas de la bandeja del conmutador NVLink
Utilice esta información para resolver problemas relacionados con la bandeja del conmutador NVLink.
Para obtener más información acerca de la interfaz de gestión del sistema (SMI), consulte Interfaz de gestión del sistema NVIDIA.
nv show system health
Ejecute el comando nv show system health para mostrar el estado de la bandeja del conmutador NVLink.
Figura 1. nv show system health
nv show cluster apps running
Ejecute el comando nv show cluster apps running para mostrar todas las aplicaciones de clúster activas que se ejecutan actualmente en el clúster de NVOS.
Figura 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
Ejecute el comando nvidia-smi-q | grep -A4 Fabric para mostrar el estado de la conexión del clúster.
Figura 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
Ejecute el comando nvidia-smi topo –p2p n para mostrar el estado de la topología de la conexión de GPU.
Figura 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
Ejecute el comando nvidia-smi nvlink -s para mostrar el estado de la conexión de NVLink.
Figura 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
Ejecute el comando nvidia-smi-q | grep Platform -A 6 para mostrar el estado de la conexión del entramado de la bandeja de computación.
Figura 6. nvidia-smi-q | grep Platform -A 6