Skip to main content
NetApp Solutions
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

NVA-1173 NetApp AIPod与NVIDIA DGX系统-硬件组件

贡献者

本节重点介绍采用NVIDIA DGX系统的NetApp AIPod的硬件组件。

NetApp AFF存储系统

NetApp AFF一流的存储系统凭借行业领先的性能、卓越的灵活性、云集成和同类最佳数据管理功能、可帮助IT部门满足企业存储需求。AFF 系统专为闪存而设计、有助于加速、管理和保护业务关键型数据。

AFF A90存储系统

由NetApp ONTAP数据管理软件提供支持的NetApp AFF A90提供内置数据保护、可选的反勒索软件功能以及支持最关键业务工作负载所需的高性能和故障恢复能力。它可以消除任务关键型运营中断、最大限度地减少性能调整、并保护数据免受勒索软件攻击。它提供:•行业领先的性能•不折不扣的数据安全性•简化的无中断升级

_ NetApp AFF A90存储系统_

图中显示了输入/输出对话框或表示已写入内容

行业领先的性能

AFF A90可轻松管理下一代工作负载、例如深度学习、AI和高速分析、以及Oracle、SAP HANA、Microsoft SQL Server和虚拟化应用程序等传统企业数据库。它可以使业务关键型应用程序以最高速度运行、每个HA对的IOPS高达240万次、延迟低至100µs微秒、与以前的NetApp型号相比、性能可提高多达50%。借助基于RDMA的NFS、pNFS和会话中继、客户可以使用现有数据中心网络基础架构实现下一代应用程序所需的高水平网络性能。客户还可以通过对SAN、NAS和对象存储的统一多协议支持进行扩展和扩展、并通过统一的和单个ONTAP数据管理软件为内部或云中的数据提供最大的灵活性。此外、Active IQ和Cloud Insights提供的基于AI的预测性分析可以优化系统运行状况。

不折不扣的数据安全性

AFF A90系统包含一整套NetApp集成的应用程序一致的数据保护软件。它提供内置数据保护和尖端的反勒索软件解决方案、用于抢占资源和攻击后恢复。可以阻止恶意文件写入磁盘、并且可以轻松监控存储异常情况以获得洞察力。

简化无中断升级

AFF A90可作为无中断机箱内升级提供给现有A800客户。NetApp通过其高级可靠性、可用性、可维护性和易管理性(RASM)功能、使更新变得简单、并消除任务关键型操作中断。此外、NetApp ONTAP软件会自动对所有系统组件应用固件更新、因此可以进一步提高运营效率并简化IT团队的日常活动。

对于规模最大的部署、AFF A1K系统可提供最高的性能和容量选项、而其他NetApp存储系统(例如AFF A70和AFF C800)则可提供成本较低的小型部署选项。

NVIDIA DGX基本POD

NVIDIA DGX BasePOD是一种集成的解决方案、由NVIDIA硬件和软件组件、MLOps解决方案和第三方存储组成。利用采用NVIDIA产品和经验证的合作伙伴解决方案的横向扩展系统设计最佳实践、客户可以实施一个高效易管理的AI开发平台。图1突出显示了NVIDIA DGX BasePOD的各个组件。

NVIDIA DGX基本解决方案

图中显示了输入/输出对话框或表示已写入内容

NVIDIA DGX H100系统

NVIDIA DGX H100™系统是AI的动力之源、它通过NVIDIA H100 T能 器核心GPU的开创性性能得到了加速。

NVIDIA DGX H100系统

图中显示了输入/输出对话框或表示已写入内容

DGX H100系统的主要规格是:•八个NVIDIA H100 GPU。•每个GPU具有80 GB GPU内存、总容量为640 GB。•四个NVIDIA NVSwitch™芯片。•两个56核英特尔®至强®白金级8480处理器,支持PCIe 5.0。2 TB的系统内存。•四个OFP端口、用于为八个单端口NVIDIA ConnectX®- 7 (InfiniBand/以太网)适配器和两个双端口NVIDIA ConnectX-7 (InfiniBand/以太网)适配器提供支持。•两个1.92 TB M.2 NVMe驱动器用于DGX操作系统、八个3.84 TB U.2 NVMe驱动器用于存储/缓存。•10.2 kW最大功率。DGX H100 CPU托盘的后部端口如下所示。其中四个OSFP端口为InfiniBand计算网络结构提供八个ConnectX-7适配器。每对双端口ConnectX-7适配器都提供指向存储和管理网络结构的并行路径。带外端口用于BMC访问。

NVIDIA DGX H100后面板

图中显示了输入/输出对话框或表示已写入内容

NVIDIA网络

NVIDIA昆特姆-2 QM9700交换机

NVIDIA昆士兰-2 QM9700 InfiniBand交换机

图中显示了输入/输出对话框或表示已写入内容

具有400 Gb/秒InfiniBand连接的NVIDIA昆特姆-2 QM9700交换机为NVIDIA昆特姆-2 InfiniBand BasePOD配置中的计算网络结构提供支持。ConnectX-7单端口适配器用于InfiniBand计算网络结构。每个NVIDIA DGX系统都与每个QM9700交换机建立了双连接、从而在系统之间提供多个高带宽、低延迟路径。

NVIDIA Spectrum 3 SN4600交换机

NVIDIA Spectrum -3 SN4600交换机

图中显示了输入/输出对话框或表示已写入内容

NVIDIA Spectrum™-3 SN4600交换机总共提供128个端口(每个交换机64个)、可为DGX BasePOD的带内管理提供冗余连接。NVIDIA SN4600交换机可提供1 GbE到200 GbE的速度。对于通过以太网连接的存储设备、还会使用NVIDIA SN4600交换机。NVIDIA DGX双端口ConnectX-7适配器上的端口用于带内管理和存储连接。

NVIDIA Spectrum SN2201交换机

NVIDIA Spectrum SN2201 switch

图中显示了输入/输出对话框或表示已写入内容

NVIDIA Spectrum SN2201交换机提供48个端口、可为带外管理提供连接。带外管理可为DGX BasePOD中的所有组件提供整合的管理连接。

NVIDIA ConnectX-7适配器

NVIDIA ConnectX-7适配器

图中显示了输入/输出对话框或表示已写入内容

NVIDIA ConnectX-7适配器可提供25/50/100/200/400G吞吐量。NVIDIA DGX系统使用单端口和双端口ConnectX-7适配器、可通过400 Gb/秒InfiniBand和以太网在DGX BasePOD部署中提供灵活性。