Skip to main content
NetApp artificial intelligence solutions
Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

Testkonfiguration

Beitragende kevin-hoke

In diesem Abschnitt werden die getesteten Konfigurationen, die Netzwerkinfrastruktur, der SR670 V2-Server und die Details zur Bereitstellung des NetApp Speichers beschrieben.

Lösungsarchitektur

Für diese Validierung haben wir die in der folgenden Tabelle aufgeführten Lösungskomponenten verwendet.

Lösungskomponenten Details

Lenovo ThinkSystem-Server

  • Zwei SR670 V2-Server mit jeweils acht NVIDIA A100 80GB GPU-Karten

  • Jeder Server enthält 2 Intel Xeon Platinum 8360Y CPUs (28 physische Kerne) und 1 TB RAM

Linux (Ubuntu – 20.04 mit CUDA 11.8)

NetApp AFF Speichersystem (HA-Paar)

  • NetApp ONTAP 9.10.1 Software

  • 24 x 960 GB SSDs

  • NFS-Protokoll

  • 1 Schnittstellengruppe (ifgrp) pro Controller mit vier logischen IP-Adressen für Mount-Punkte

Bei dieser Validierung haben wir ResNet v2.0 mit dem ImageNet-Basissatz gemäß MLPerf v2.0 verwendet. Der Datensatz wird in einem NetApp AFF Speichersystem mit dem NFS-Protokoll gespeichert. Die SR670 wurden über einen 100GbE-Switch mit dem NetApp AFF A400 -Speichersystem verbunden.

ImageNet ist ein häufig verwendeter Bilddatensatz. Es enthält fast 1,3 Millionen Bilder mit einer Gesamtgröße von 144 GB. Die durchschnittliche Bildgröße beträgt 108 KB.

Die folgende Abbildung zeigt die Netzwerktopologie der getesteten Konfiguration.

Diese Grafik zeigt die Rechenschicht, ein Lenovo ThinkSystem SR670 V2, die Netzwerkschicht, einen Lenovo Ethernet-Switch, und die Speicherschicht, einen NetApp AFF A400 -Speichercontroller.  Alle Netzwerkverbindungen sind inklusive.

Speichercontroller

In der folgenden Tabelle ist die Speicherkonfiguration aufgeführt.

Regler Aggregat FlexGroup -Volumen Aggregatgröße Volumengröße Einhängepunkt des Betriebssystems

Controller1

Aggr1

/a400-100g

9,9 TB

19 TB

/a400-100g

Controller2

Aggr2

/a400-100g

9,9 TB

/a400-100g

Hinweis Der Ordner /a400-100g enthält den für die ResNet-Validierung verwendeten Datensatz.