Configuración de prueba
Esta sección describe las configuraciones probadas, la infraestructura de red, el servidor SR670 V2 y los detalles de aprovisionamiento de almacenamiento de NetApp .
Arquitectura de la solución
Para esta validación utilizamos los componentes de la solución enumerados en la siguiente tabla.
| Componentes de la solución | Detalles |
|---|---|
Servidores Lenovo ThinkSystem |
|
Linux (Ubuntu – 20.04 con CUDA 11.8) |
|
Sistema de almacenamiento NetApp AFF (par HA) |
|
En esta validación, utilizamos ResNet v2.0 con la base ImageNet establecida según lo especificado por MLPerf v2.0. El conjunto de datos se almacena en un sistema de almacenamiento NetApp AFF con el protocolo NFS. Los SR670 se conectaron al sistema de almacenamiento NetApp AFF A400 a través de un conmutador 100 GbE.
ImageNet es un conjunto de datos de imágenes utilizado con frecuencia. Contiene casi 1,3 millones de imágenes para un tamaño total de 144 GB. El tamaño promedio de la imagen es 108 KB.
La siguiente figura muestra la topología de red de la configuración probada.

Controlador de almacenamiento
La siguiente tabla enumera la configuración de almacenamiento.
| Controladora | Agregar | Volumen de FlexGroup | Tamaño del agregado | Tamaño del volumen | Punto de montaje del sistema operativo |
|---|---|---|---|---|---|
Controller1 |
Aggr1 |
/a400-100g |
9,9 TB |
19 TB |
/a400-100g |
Controller2 |
Aggr2 |
/a400-100g |
9,9 TB |
/a400-100g |
|
|
La carpeta /a400-100g contiene el conjunto de datos utilizado para la validación de ResNet. |