Probleme mit dem NVLink-Switch-Einbaurahmen
Verwenden Sie diese Informationen, um Probleme im Zusammenhang mit dem NVLink-Switch-Einbaurahmen zu beheben.
Weitere Informationen zur Systemverwaltungsschnittstelle (System Management Interface, SMI) finden Sie unter NVIDIA-Systemverwaltungsschnittstelle.
nv show system health
Führen Sie den Befehl nv show system health aus, um den Integritätsstatus des NVLink-Switch-Einbaurahmens anzuzeigen.
Abbildung 1. nv show system health
nv show cluster apps running
Führen Sie den Befehl nv show cluster apps running aus, um alle aktuell im NVOS-Cluster ausgeführten Clusteranwendungen anzuzeigen.
Abbildung 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
Führen Sie den Befehl nvidia-smi-q | grep -A4 Fabric aus, um den Status der Clusterverbindung anzuzeigen.
Abbildung 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
Führen Sie den Befehl nvidia-smi topo –p2p n aus, um den Status der GPU-Verbindungstopologie anzuzeigen.
Abbildung 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
Führen Sie den Befehl nvidia-smi nvlink -s aus, um den Status der NVLink-Verbindung anzuzeigen.
Abbildung 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
Führen Sie den Befehl nvidia-smi-q | grep Platform -A 6 aus, um den Einbaurahmen-Fabric-Verbindungsstatus anzuzeigen.
Abbildung 6. nvidia-smi-q | grep Platform -A 6