Problemas relacionados à bandeja do comutador NVLink
Utilize essas informações para resolver problemas relacionados à bandeja do comutador NVLink.
Para obter mais informações sobre a Interface de Gerenciamento do Sistema (SMI), consulte Interface de Gerenciamento do Sistema NVIDIA.
nv show system health
Execute o comando nv show system health para exibir o status de funcionamento da bandeja do comutador NVLink.
Figura 1. nv show system health
nv show cluster apps running
Execute o comando nv show cluster apps running para exibir todos os aplicativos ativos do cluster que estão atualmente em execução no cluster NVOS.
Figura 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
Execute o comando nvidia-smi-q | grep -A4 Fabric para exibir o status de conexão do cluster.
Figura 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
Execute o comando nvidia-smi topo –p2p n para exibir o status da topologia de conexão da GPU.
Figura 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
Execute o comando nvidia-smi nvlink -s para exibir o status da conexão NVLink.
Figura 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
Execute o comando nvidia-smi-q | grep Platform -A 6 para exibir o status de conexão da malha da bandeja de cálculo.
Figura 6. nvidia-smi-q | grep Platform -A 6