Testkonfiguration
In diesem Abschnitt werden die getesteten Konfigurationen, die Netzwerkinfrastruktur, der SR670 V2 Server und Details zur Storage-Bereitstellung von NetApp beschrieben.
Lösungsarchitektur
Für diese Validierung wurden die in der folgenden Tabelle aufgeführten Lösungskomponenten verwendet.
Lösungskomponenten | Details |
---|---|
Lenovo ThinkSystem-Server |
|
Linux (Ubuntu – 20.04 mit CUDA 11.8) |
|
NetApp AFF Storage-System (HA-Paar) |
|
In dieser Validierung haben wir ResNet v2.0 mit dem von MLPerf v2.0 angegebenen ImageNet-Basissatz verwendet. Der Datensatz wird mithilfe des NFS-Protokolls in einem NetApp AFF Storage-System gespeichert. Die SR670s waren über einen 100-GbE-Switch mit dem NetApp AFF A400 Storage-System verbunden.
ImageNet ist ein häufig verwendeter Bilddatensatz. Es enthält fast 1.3 Millionen Bilder für eine Gesamtgröße von 144 GB. Die durchschnittliche Bildgröße beträgt 108 KB.
Die folgende Abbildung zeigt die Netzwerktopologie der getesteten Konfiguration.
Storage Controller
In der folgenden Tabelle wird die Storage-Konfiguration aufgeführt.
Controller | Aggregat | FlexGroup Volume | Aggregatgröße | Volume-Größe | Bereitstellungspunkt für Betriebssystem |
---|---|---|---|---|---|
Kontroller1 |
Aggr. 1 |
/a400-100g |
9,9 TB |
19 TB |
/a400-100g |
Controller 2 |
Aggr. 2 |
/a400-100g |
9,9 TB |
/a400-100g |
Der Ordner /a400-100g enthält den Datensatz, der für die ResNet-Validierung verwendet wird. |