Configuração de teste
Esta seção descreve as configurações testadas, a infraestrutura de rede, o servidor SR670 V2 e os detalhes de provisionamento de armazenamento da NetApp .
Arquitetura da solução
Usamos os componentes da solução listados na tabela a seguir para esta validação.
| Componentes da solução | Detalhes |
|---|---|
Servidores Lenovo ThinkSystem |
|
Linux (Ubuntu – 20.04 com CUDA 11.8) |
|
Sistema de armazenamento NetApp AFF (par HA) |
|
Nesta validação, usamos o ResNet v2.0 com o conjunto de base ImageNet conforme especificado pelo MLPerf v2.0. O conjunto de dados é armazenado em um sistema de armazenamento NetApp AFF com o protocolo NFS. Os SR670s foram conectados ao sistema de armazenamento NetApp AFF A400 por meio de um switch de 100 GbE.
ImageNet é um conjunto de dados de imagens frequentemente usado. Ele contém quase 1,3 milhão de imagens, totalizando 144 GB. O tamanho médio da imagem é 108 KB.
A figura a seguir descreve a topologia de rede da configuração testada.

Controlador de armazenamento
A tabela a seguir lista a configuração de armazenamento.
| Controlador | Agregar | Volume FlexGroup | Tamanho agregado | Tamanho do volume | Ponto de montagem do sistema operacional |
|---|---|---|---|---|---|
Controller1 |
Aggr1 |
/a400-100g |
9,9 TB |
19 TB |
/a400-100g |
Controller2 |
Aggr2 |
/a400-100g |
9,9 TB |
/a400-100g |
|
|
A pasta /a400-100g contém o conjunto de dados usado para validação do ResNet. |