Teste a configuração
Esta seção descreve as configurações testadas, a infraestrutura de rede, o servidor SR670 V2 e os detalhes do provisionamento de storage do NetApp.
Arquitetura da solução
Usamos os componentes da solução listados na tabela a seguir para essa validação.
Componentes da solução | Detalhes |
---|---|
Servidores Lenovo ThinkSystem |
|
Linux (Ubuntu – 20,04 com CUDA 11,8) |
|
Sistema de storage NetApp AFF (par de HA) |
|
Nesta validação, utilizamos o ResNet v2,0 com o conjunto base IMAGEnet, conforme especificado pelo MLPerf v2,0. O conjunto de dados é armazenado em um sistema de storage NetApp AFF com o protocolo NFS. Os SR670s foram conetados ao sistema de storage NetApp AFF A400 por meio de um switch de 100GbE GbE.
O IMAGEnet é um conjunto de dados de imagens frequentemente utilizado. Ele contém quase 1,3 milhões de imagens para um tamanho total de 144GB. O tamanho médio da imagem é 108KB.
A figura a seguir mostra a topologia de rede da configuração testada.
Controlador de storage
A tabela a seguir lista a configuração de armazenamento.
Controlador | Agregado | Volume FlexGroup | Tamanho agregado | Tamanho do volume | Ponto de montagem do sistema operacional |
---|---|---|---|---|---|
Controller1 |
Aggr1 |
/a400-100g |
9,9 TB |
19 TB |
/a400-100g |
Controller2 |
Aggr2 |
/a400-100g |
9,9 TB |
/a400-100g |
A pasta /A400-100g contém o conjunto de dados usado para validação ResNet. |