NVLink 스위치 트레이 관련 문제
이 내용을 사용하여 NVLink 스위치 트레이와 관련된 문제를 해결하십시오.
NVLink 스위치는 NVOS를 스위치 CLI 관리 인터페이스로 사용합니다. 다음 NVOS 명령을 사용하여 단일 NVLink 스위치 트레이의 상태를 모니터링하십시오.
또한 컴퓨팅 트레이에서 다음 nvidia-smi 명령을 실행하여 NVLink 스위치 트레이와의 연결 상태를 확인하십시오.
시스템 관리 인터페이스(SMI)에 대한 자세한 내용은 NVIDIA 시스템 관리 인터페이스의 내용을 참조하십시오.
nv show system health
nv show system health 명령을 실행하여 NVLink 스위치 트레이 상태를 표시합니다.
그림 1. nv show system health
nv show cluster apps running
nv show cluster apps running 명령을 실행하여 NVOS 클러스터에서 현재 실행 중인 모든 활성 클러스터 응용 프로그램을 표시합니다.
그림 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
nvidia-smi-q | grep -A4 Fabric 명령을 실행하여 클러스터 연결 상태를 표시합니다.
그림 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
nvidia-smi topo –p2p n 명령을 실행하여 GPU 연결 토폴로지 상태를 표시합니다.
그림 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
nvidia-smi nvlink -s 명령을 실행하여 NVLink 연결 상태를 표시합니다.
그림 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
nvidia-smi-q | grep Platform -A 6 명령을 실행하여 컴퓨팅 트레이 패브릭 연결 상태를 표시합니다.
그림 6. nvidia-smi-q | grep Platform -A 6
피드백 보내기