NVLink スイッチ・トレイの問題
NVLink スイッチ・トレイに関連する問題を解決するには、この情報を使用してください。
NVLink スイッチは、スイッチの CLI 管理インターフェースとして NVOS を利用します。単一の NVLink スイッチ・トレイのステータスを監視するには、次の NVOS コマンドを使用します。
加えて、コンピュート・トレイ上で以下の nvidia-smi コマンドを実行して、NVLink スイッチ・トレイとの接続ステータスを確認します。
システム管理インターフェース (SMI) について詳しくは、NVIDIA システム管理インターフェースを参照してください。
nv show system health
NVLink スイッチ・トレイのヘルス・ステータスを表示するには、nv show system health コマンドを実行します。
図 1. nv show system health
nv show cluster apps running
NVOS クラスターで現在実行中のすべてのアクティブなクラスター・アプリケーションを表示するには、nv show cluster apps running コマンドを実行します。
図 2. nv show cluster apps running
nvidia-smi-q | grep -A4 Fabric
クラスター接続ステータスを表示するには、nvidia-smi-q | grep -A4 Fabric コマンドを実行します。
図 3. nvidia-smi-q | grep -A4 Fabric
nvidia-smi topo –p2p n
GPU 接続トポロジーのステータスを表示するには、nvidia-smi topo –p2p n コマンドを実行します。
図 4. nvidia-smi topo –p2p n
nvidia-smi nvlink -s
NVLink 接続ステータスを表示するには、nvidia-smi nvlink -s コマンドを実行します。
図 5. nvidia-smi nvlink -s
nvidia-smi-q | grep Platform -A 6
コンピュート・トレイのファブリック接続ステータスを表示するには、nvidia-smi-q | grep Platform -A 6 コマンドを実行します。
図 6. nvidia-smi-q | grep Platform -A 6
フィードバックを送る