Problemi relativi alla GPU
Usare queste informazioni per risolvere i problemi correlati alle GPU nel vassoio di elaborazione.
Usare uno dei comandi seguenti per verificare lo stato di integrità delle GPU. Assicurarsi di aggiornare il driver delle GPU, che include le seguenti utilità richieste. Il driver più recente è disponibile all'indirizzo Sito Web per il download di driver e software per Lenovo NVIDIA GB300 NVL72.
Per altre informazioni sull'interfaccia SMI (System Management Interface), vedere Interfaccia di gestione del sistema NVIDIA.
nvidia-smi
Eseguire il comando nvidia-smi per visualizzare le quattro GPU online.
Figura 1. nvidia-smi
nvidia-smi topo –p2p n
Eseguire il comando nvidia-smi topo –p2p n per visualizzare lo stato della connessione interna tra le GPU in un singolo vassoio di elaborazione.NotaLo statoUnknown per qualsiasi collegamento alle GPU indica un possibile problema hardware relativo a una GPU, al vassoio per switch NVLink o a una cartuccia per cavi. Figura 2. nvidia-smi topo –p2p n
nvidia-smi -q --id=1 -f <output file name>
Eseguire il comando nvidia-smi -q --id=1 -f <output file name> per esportare le informazioni di inventario delle GPU.
Digitare il nome del file desiderato in <output file name> per memorizzare l'output. Ad esempio: nvidia-smi -q --id=1 -f /tmp/queryoam1.txt.
Figura 3. nvidia-smi -q --id=1 -f <output file name>==============NVSMI LOG==============
Timestamp : Mon Mar 30 02:14:58 2026
Driver Version : 580.105.08
CUDA Version : 13.0
Attached GPUs : 4
GPU 00000009:06:00.0
Product Name : NVIDIA GB300
Product Brand : NVIDIA
Product Architecture : Blackwell
Display Mode : Requested functionality has been deprecated
Display Attached : No
Display Active : Disabled
Persistence Mode : Enabled
Addressing Mode : ATS
MIG Mode
Current : Disabled
Pending : Disabled
Accounting Mode : Disabled
Accounting Mode Buffer Size : 4000
Driver Model
Current : N/A
Pending : N/A
Serial Number : 1652725032738
GPU UUID : GPU-29255b40-4ad2-6e15-a7e2-634503314135
GPU PDI : 0xca89506c512681b3
Minor Number : 1
VBIOS Version : 97.10.4A.00.1F
MultiGPU Board : No
Board ID : 0x90600
Board Part Number : 900-2G548-0081-000
GPU Part Number : 31C2-893-A1
FRU Part Number : N/A
Platform Info
Chassis Serial Number : 1822725187334
Slot Number : 26
Tray Index : 16
Host ID : 1
Peer Type : Switch Connected
Module Id : 1
GPU Fabric GUID : 0xca89506c512681b3
Inforom Version
Image Version : G548.0301.00.03
OEM Object : 2.1
ECC Object : 7.16
Power Management Object : N/A
Inforom BBX Object Flush
Latest Timestamp : 2026/03/29 08:57:08.426
Latest Duration : 56215 us
GPU Operation Mode
Current : N/A
Pending : N/A
GPU C2C Mode : Enabled
nvidia-smi nvlink -s
Eseguire il comando nvidia-smi nvlink -s per visualizzare lo stato della connessione NVLink.
Figura 4. nvidia-smi nvlink -s
Envoyer des commentaires