跳至主要内容

功能

在設計機架解決方案時,效能、運作效率和網路架構可靠性是主要考量因素。

機架解決方案實作下列功能和技術:
  • 高 HBM3e 頻寬

    該機架解決方案採用 HBM3e 技術,在 72-GPU NVLink 架構中提供總計 20.7 TB 的 HBM3e。因此,系統能夠即時處理大型 AI 模型並應對大量科學數據。

  • 高網路頻寬

    該機架解決方案具備透過 NVIDIA BlueField-3 DPU 配接卡或 ConnectX-8 SuperNIC 提供的高速網路連接功能。這種整合式架構在整個機架中提供大量聚合頻寬,確保大規模 AI 工作負載的數據流暢通無阻。

  • 超大系統記憶體容量

    本系統採用統一的記憶體架構,將具備錯誤更正碼 (ECC) 的 LPDDR5X 記憶體直接整合於 NVIDIA Grace 處理器上。每個機架可提供高達 17.3 TB 的系統記憶體。

  • 大型資料儲存容量和熱抽換功能

    每個運算匣都支援高速 E1.S 硬碟,提供本地資料暫存。有了熱抽換功能,您就可以在不需關閉運算匣的情況下新增、卸下或更換固態硬碟。

  • Lightpath 診斷

    Lightpath 診斷提供 LED,協助您診斷問題。如需 Lightpath 診斷的相關資訊,請參閱透過系統 LED 和診斷顯示器進行疑難排解