Skip to main content
NetApp Solutions
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

测试配置

贡献者

本节介绍测试的配置、网络基础架构、SR670V2服务器以及NetApp存储配置详细信息。

解决方案架构

我们使用下表中列出的解决方案 组件进行了此验证。

解决方案组件 详细信息

联想 ThinkSystem 服务器

  • 两个SR670V2服务器、每个服务器具有八个NVIDIA A100 80 GB GPU卡

  • 每台服务器包含2个Intel Xeon Platinum 8360Y CPU (28个物理核心)和1 TB RAM

Linux (Ubuntu—20.04与CUDA 11.8)

NetApp AFF 存储系统(HA对)

  • NetApp ONTAP 9.10.1软件

  • 24 个 960 GB SSD

  • NFS 协议

  • 每个控制器1个接口组(ifgrp)、挂载点有四个逻辑IP地址

在此验证中、我们使用的是RESNET v2.0、并且ImageNet基础设置为由MLPerf v2.0指定的基础。数据集存储在采用NFS协议的NetApp AFF 存储系统中。SR670s通过100GbE交换机连接到NetApp AFF A400存储系统。

ImageNet是一个常用的映像数据集。它包含近130万个映像、总大小为144 GB。平均映像大小为108 KB。

下图显示了测试配置的网络拓扑。

此图展示了计算层、联想ThinkSystem SR670V2、网络层、联想以太网交换机和存储层、即NetApp AFF A400存储控制器。包括所有网络连接。

存储控制器

下表列出了存储配置。

控制器 聚合 FlexGroup 卷 聚合大小 卷大小 操作系统挂载点

控制器 1

aggr1.

/a400-100g

9.9 TB

19 TB

/a400-100g

控制器 2.

Aggr2.

/a400-100g

9.9 TB

/a400-100g

备注 /a400-100g文件夹包含用于RESNET验证的数据集。