Skip to main content
NetApp Solutions
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

NVA-1173 NetApp AIPod 搭配 NVIDIA DGX 系統 - 硬體元件

貢獻者

本節重點介紹 NetApp AIPod 搭配 NVIDIA DGX 系統的硬體元件。

NetApp AFF 儲存系統

NetApp AFF 最先進的儲存系統、讓 IT 部門能夠以領先業界的效能、優異的靈活度、雲端整合、以及同級最佳的資料管理、滿足企業儲存需求。專為Flash而設計AFF 的支援功能、可協助加速、管理及保護業務關鍵資料。

AFF A90 儲存系統

搭載 NetApp ONTAP 資料管理軟體的 NetApp AFF A90 提供內建資料保護、選購的反勒索軟體功能、以及支援最關鍵業務工作負載所需的高效能與恢復能力。它可避免對關鍵任務作業造成中斷、將效能調校降至最低、並保護資料免受勒索軟體攻擊。它提供:•領先業界的效能•毫不妥協的資料安全性•簡化不中斷升級

NetApp AFF A90 儲存系統 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

領先業界的效能

AFF A90 可輕鬆管理深度學習、 AI 和高速分析等新一代工作負載、以及 Oracle 、 SAP HANA 、 Microsoft SQL Server 和虛擬化應用程式等傳統企業資料庫。它可讓業務關鍵應用程式以最高速度執行、每個 HA 配對最多可達 240 萬 IOPS 、延遲低至 100 µ s 、效能比先前的 NetApp 機型高達 50% 。有了 NFS over RDMA 、 pNFS 和工作階段 Trunking 、客戶就能使用現有的資料中心網路基礎架構、達到新一代應用程式所需的高網路效能。客戶也可以透過統一化的多重傳輸協定支援來擴充 SAN 、 NAS 和物件儲存設備、並透過統一化的單一 ONTAP 資料管理軟體、在內部部署或雲端中提供最大的靈活度。此外、 Active IQ 和 Cloud Insights 也提供 AI 型預測分析功能、可最佳化系統健全狀況。

毫不妥協的資料安全性

AFF A90 系統包含一套完整的 NetApp 整合式與應用程式一致的資料保護軟體。它提供內建的資料保護功能、以及先進的反勒索軟體解決方案、可用於搶佔和攻擊後恢復。惡意檔案可能遭到封鎖、無法寫入磁碟、而且儲存異常狀況也可輕鬆監控、以獲得深入見解。

簡化不中斷升級

AFF A90 可作為不中斷營運的機箱內升級、升級至現有 A800 客戶。NetApp 透過我們先進的可靠性、可用度、可維修性和管理性( RASM )功能、讓您輕鬆更新並消除對關鍵任務作業的中斷。此外、 NetApp 還能進一步提升營運效率、並簡化 IT 團隊的日常活動、因為 ONTAP 軟體會自動為所有系統元件套用韌體更新。

對於規模最大的部署、 AFF A1K 系統提供最高的效能和容量選項、而其他 NetApp 儲存系統(例如 AFF A70 和 AFF C800 )則提供更低成本的小型部署選項。

NVIDIA DGX基礎POD

NVIDIA DGX BasePOD 是整合式解決方案、包含 NVIDIA 硬體和軟體元件、 MLOps 解決方案和協力廠商儲存設備。客戶可運用 NVIDIA 產品和驗證的合作夥伴解決方案的橫向擴充系統設計最佳實務做法、為 AI 開發建置高效率且可管理的平台。圖 1 重點介紹 NVIDIA DGX BasePOD 的各種元件。

NVIDIA DGX BasePOD 解決方案 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA DGX H100 系統

NVIDIA DGX H100&#8482 ;系統是 AI 的強大功能、可透過 NVIDIA H100 Tensor Core GPU 的突破性效能加速。

NVIDIA DGX H100 系統 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

DGX H100 系統的主要規格為:•八個 NVIDIA H100 GPU 。•每個 GPU 80 GB GPU 記憶體、總計 640GB 。•四個 NVIDIA NVSwitch ™晶片。•支援 PCIe 5.0 的雙 56 核心 Intel ® Xeon ® Platinum 8480 處理器。• 2 TB 的 DDR5 系統記憶體。•四個 OSFP 連接埠、可服務八個單埠 NVIDIA ConnectX®-7 ( InfiniBand / 乙太網路)介面卡、以及兩個雙埠 NVIDIA ConnectX-7 ( InfiniBand / 乙太網路)介面卡。•兩個適用於 DGX 作業系統的 1.92 TB M.2 NVMe 磁碟機、八個用於儲存 / 快取的 3.84 TB U.2 NVMe 磁碟機。•最大 10.2 kw 功率。DGX H100 CPU 匣的後端連接埠如下所示。四個 OFP 連接埠可為 InfiniBand 運算架構提供八個 ConnectX-7 介面卡。每對雙連接埠 ConnectX-7 介面卡都提供平行路徑、可通往儲存和管理架構。頻外連接埠用於 BMC 存取。

_NVIDIA DGX H100 後面板 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA Networking

NVIDIA Quantum-2 QM9700 交換器

_NVIDIA Quantum-2 QM9700 InfiniBand 交換器 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA Quantum-2 QM9700 交換器搭配 400GB / 秒 InfiniBand 連線能力、可為 NVIDIA Quantum-2 InfiniBand BasePOD 組態中的運算架構提供強大動力。ConnectX-7 單埠介面卡用於 InfiniBand 運算架構。每個 NVIDIA DGX 系統都有兩個連線至每個 QM9700 交換器、可在系統之間提供多個高頻寬、低延遲的路徑。

NVIDIA Spectrum 3 SN4600 交換器

_NVIDIA Spectrum 3 SN4600 交換器 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA Spectrum 和 #8482;-3 SN4600 交換器總共提供 128 個連接埠(每個交換器 64 個)、以提供備援連線功能、以利 DGX BasePOD 的頻內管理。NVIDIA SN4600 交換器可提供介於 1 GbE 和 200 GbE 之間的速度。對於透過乙太網路連線的儲存設備、也會使用 NVIDIA SN4600 交換器。NVIDIA DGX 雙連接埠 ConnectX-7 介面卡上的連接埠可用於頻內管理和儲存連線。

NVIDIA Spectrum SN2201 交換器

_NVIDIA Spectrum SN2201 交換器 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA Spectrum SN2201 交換器提供 48 個連接埠、可提供頻外管理的連線功能。頻外管理可為 DGX BasePOD 中的所有元件提供整合式管理連線。

NVIDIA ConnectX-7 介面卡

_NVIDIA ConnectX-7 介面卡 _

此圖顯示輸入 / 輸出對話方塊或表示寫入內容

NVIDIA ConnectX-7 介面卡可提供 25/50/100/200/400G 的處理量。NVIDIA DGX 系統同時使用單連接埠和雙連接埠 ConnectX-7 介面卡、以使用 400GB InfiniBand 和乙太網路、提供 DGX BasePOD 部署的靈活度。