Testkonfiguration
In diesem Abschnitt werden die getesteten Konfigurationen, die Netzwerkinfrastruktur, der SR670 V2-Server und die Details zur Bereitstellung des NetApp Speichers beschrieben.
Lösungsarchitektur
Für diese Validierung haben wir die in der folgenden Tabelle aufgeführten Lösungskomponenten verwendet.
| Lösungskomponenten | Details |
|---|---|
Lenovo ThinkSystem-Server |
|
Linux (Ubuntu – 20.04 mit CUDA 11.8) |
|
NetApp AFF Speichersystem (HA-Paar) |
|
Bei dieser Validierung haben wir ResNet v2.0 mit dem ImageNet-Basissatz gemäß MLPerf v2.0 verwendet. Der Datensatz wird in einem NetApp AFF Speichersystem mit dem NFS-Protokoll gespeichert. Die SR670 wurden über einen 100GbE-Switch mit dem NetApp AFF A400 -Speichersystem verbunden.
ImageNet ist ein häufig verwendeter Bilddatensatz. Es enthält fast 1,3 Millionen Bilder mit einer Gesamtgröße von 144 GB. Die durchschnittliche Bildgröße beträgt 108 KB.
Die folgende Abbildung zeigt die Netzwerktopologie der getesteten Konfiguration.

Speichercontroller
In der folgenden Tabelle ist die Speicherkonfiguration aufgeführt.
| Regler | Aggregat | FlexGroup -Volumen | Aggregatgröße | Volumengröße | Einhängepunkt des Betriebssystems |
|---|---|---|---|---|---|
Controller1 |
Aggr1 |
/a400-100g |
9,9 TB |
19 TB |
/a400-100g |
Controller2 |
Aggr2 |
/a400-100g |
9,9 TB |
/a400-100g |
|
|
Der Ordner /a400-100g enthält den für die ResNet-Validierung verwendeten Datensatz. |