简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。
测试配置
本节介绍测试的配置、网络基础设施、SR670 V2 服务器和NetApp存储配置详细信息。
解决方案架构
我们使用下表列出的解决方案组件进行此验证。
| 解决方案组件 | 详细信息 |
|---|---|
联想 ThinkSystem 服务器 |
|
Linux(Ubuntu - 20.04,带有 CUDA 11.8) |
|
NetApp AFF存储系统(HA 对) |
|
在本次验证中,我们使用了 ResNet v2.0 和 MLPerf v2.0 指定的 ImageNet 基集。数据集存储在具有 NFS 协议的NetApp AFF存储系统中。 SR670 通过 100GbE 交换机连接到NetApp AFF A400存储系统。
ImageNet 是一个经常使用的图像数据集。它包含近 130 万张图片,总大小为 144GB。平均图像大小为 108KB。
下图描述了测试配置的网络拓扑。

存储控制器
下表列出了存储配置。
| 控制器 | 聚合 | FlexGroup 卷 | 骨料大小 | 卷大小 | 操作系统挂载点 |
|---|---|---|---|---|---|
Controller1 |
Aggr1 |
/a400-100克 |
9.9 TB |
19 TB |
/a400-100克 |
Controller2 |
Aggr2 |
/a400-100克 |
9.9 TB |
/a400-100克 |
|
|
/a400-100g 文件夹包含用于 ResNet 验证的数据集。 |