Skip to main content
NetApp Solutions
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Eseguire il test della configurazione

Collaboratori

Questa sezione descrive le configurazioni testate, l'infrastruttura di rete, il server SR670 V2 e i dettagli sul provisioning dello storage NetApp.

Architettura della soluzione

Per questa convalida sono stati utilizzati i componenti della soluzione elencati nella tabella seguente.

Componenti della soluzione Dettagli

Server Lenovo ThinkSystem

  • Due server SR670 V2 ciascuno con otto schede GPU NVIDIA A100 da 80 GB

  • Ogni server contiene 2 CPU Intel Xeon Platinum 8360Y (28 core fisici) e 1 TB di RAM

Linux (Ubuntu – 20.04 con CUDA 11.8)

Sistema storage NetApp AFF (coppia ha)

  • Software NetApp ONTAP 9.10.1

  • 24x 960 GB SSD

  • Protocollo NFS

  • 1 gruppo di interfacce (ifgrp) per controller, con quattro indirizzi IP logici per i mount point

In questa convalida, abbiamo utilizzato ResNet v2.0 con il set di base ImageNet come specificato da MLPerf v2.0. Il set di dati viene memorizzato in un sistema storage NetApp AFF con protocollo NFS. Gli SR670 sono stati collegati al sistema di storage NetApp AFF A400 tramite uno switch 100GbE.

ImageNet è un set di dati di immagini utilizzato di frequente. Contiene quasi 1.3 milioni di immagini per una dimensione totale di 144 GB. La dimensione media dell'immagine è di 108 KB.

La seguente figura illustra la topologia di rete della configurazione testata.

Questa immagine mostra il livello di elaborazione, un Lenovo ThinkSystem SR670 V2, il livello di rete, uno switch Ethernet Lenovo e il livello di storage, un controller di storage NetApp AFF A400. Sono incluse tutte le connessioni di rete.

Controller dello storage

La seguente tabella elenca la configurazione dello storage.

Controller Aggregato Volume FlexGroup Dimensione dell'aggregato Dimensione del volume Punto di montaggio del sistema operativo

Controller 1

Aggr1

/a400-100g

9,9 TB

19 TB

/a400-100g

Controller 2

Aggr2

/a400-100g

9,9 TB

/a400-100g

Nota La cartella /a400-100g contiene il set di dati utilizzato per la convalida ResNet.