Aperçu de la technologie
Cette section décrit les fondements technologiques de cette solution d’IA.
Systèmes NetApp AFF
Les systèmes de stockage NetApp AFF de pointe permettent des déploiements d'inférence d'IA à la périphérie pour répondre aux exigences de stockage de l'entreprise avec des performances de pointe, une flexibilité supérieure, une intégration cloud et une gestion des données de premier ordre. Conçus spécifiquement pour le flash, les systèmes NetApp AFF aident à accélérer, gérer et protéger les données critiques pour l'entreprise.
-
Les systèmes de stockage NetApp AFF d'entrée de gamme sont basés sur le matériel FAS2750 et les supports flash SSD
-
Deux contrôleurs en configuration HA

Les systèmes de stockage d'entrée de gamme NetApp AFF C190 prennent en charge les fonctionnalités suivantes :
-
Un nombre maximal de disques SSD de 24x 960 Go
-
Deux configurations possibles :
-
Ethernet (10 GbE) : 4 ports 10GBASE-T (RJ-45)
-
Unifié (16 Gb FC ou 10 GbE) : 4 ports d'adaptateur cible unifié 2 (UTA2)
-
-
Une capacité effective maximale de 50,5 To
Pour les charges de travail NAS, un seul système AFF C190 d'entrée de gamme prend en charge un débit de 4,4 Gbit/s pour les lectures séquentielles et de 230 000 IOPS pour les petites lectures aléatoires à des latences de 1 ms ou moins.
NetApp AFF A220
NetApp propose également d’autres systèmes de stockage d’entrée de gamme qui offrent des performances et une évolutivité supérieures pour les déploiements à plus grande échelle. Pour les charges de travail NAS, un seul système AFF A220 d'entrée de gamme prend en charge :
-
Débit de 6,2 Gbit/s pour les lectures séquentielles
-
375 000 IOPS pour de petites lectures aléatoires avec des latences de 1 ms ou moins
-
Nombre maximal de disques SSD : 144 x 960 Go, 3,8 To ou 7,6 To
-
AFF A220 peut évoluer jusqu'à une capacité effective supérieure à 1 Po
NetApp AFF A250
-
La capacité effective maximale est de 35 Po avec une évolutivité maximale de 2 à 24 nœuds (12 paires HA)
-
Offre une augmentation des performances ≥ 45 % par rapport à AFF A220
-
440 000 IOPS en lectures aléatoires à 1 ms
-
Construit sur la dernière version de NetApp ONTAP : ONTAP 9.8
-
Exploite deux ports Ethernet 25 Gb pour l'interconnexion HA et cluster
Systèmes EF NetApp série E
La série EF est une famille de baies de stockage SAN 100 % flash d'entrée et de milieu de gamme qui peuvent accélérer l'accès à vos données et vous aider à en tirer profit plus rapidement grâce au logiciel NetApp SANtricity . Ces systèmes offrent à la fois un stockage flash SAS et NVMe et vous offrent des IOPS abordables à extrêmes, des temps de réponse inférieurs à 100 microsecondes et une bande passante allant jusqu'à 44 Gbit/s, ce qui les rend idéaux pour les charges de travail mixtes et les applications exigeantes telles que l'inférence IA et le calcul haute performance (HPC).
La figure suivante montre le système de stockage NetApp EF280.

NetApp EF280
-
Prise en charge FC 32 Go/16 Go, iSCSI 25 Go/10 Go et SAS 12 Go
-
La capacité effective maximale est de 96 disques totalisant 1,5 Po
-
Débit de 10 Gbit/s (lectures séquentielles)
-
300 000 IOP (lectures aléatoires)
-
Le NetApp EF280 est la baie entièrement flash (AFA) la moins chère du portefeuille NetApp
NetApp EF300
-
24 disques SSD NVMe pour une capacité totale de 367 To
-
Options d'extension totalisant 240 disques durs NL-SAS, 96 SSD SAS ou une combinaison
-
100 Go NVMe/IB, NVMe/RoCE, iSER/IB et SRP/IB
-
NVME/FC 32 Go, FCP
-
iSCSI 25 Go
-
20 Gbit/s (lectures séquentielles)
-
670 000 IOP (lectures aléatoires)
|
|
Pour plus d'informations, consultez le "Fiche technique des NetApp 100 % flash NetApp EF-Series EF600, F300, EF570 et EF280" . |
NetApp ONTAP 9
ONTAP 9.8.1, la dernière génération de logiciel de gestion du stockage de NetApp, permet aux entreprises de moderniser leur infrastructure et de passer à un centre de données prêt pour le cloud. En s'appuyant sur des capacités de gestion de données de pointe, ONTAP permet la gestion et la protection des données avec un seul ensemble d'outils, quel que soit l'endroit où résident ces données. Vous pouvez également déplacer librement les données là où elles sont nécessaires : vers la périphérie, le cœur ou le cloud. ONTAP 9.8.1 inclut de nombreuses fonctionnalités qui simplifient la gestion des données, accélèrent et protègent les données critiques et permettent des capacités d'infrastructure de nouvelle génération dans les architectures de cloud hybride.
Simplifier la gestion des données
La gestion des données est essentielle aux opérations informatiques de l’entreprise afin que les ressources appropriées soient utilisées pour les applications et les ensembles de données. ONTAP inclut les fonctionnalités suivantes pour rationaliser et simplifier les opérations et réduire le coût total d'exploitation :
-
Compactage des données en ligne et déduplication étendue. La compaction des données réduit l’espace gaspillé à l’intérieur des blocs de stockage et la déduplication augmente considérablement la capacité effective. Cela s’applique aux données stockées localement et aux données hiérarchisées vers le cloud.
-
Qualité de service minimale, maximale et adaptative (AQoS). Les contrôles granulaires de qualité de service (QoS) aident à maintenir les niveaux de performances des applications critiques dans les environnements hautement partagés.
-
* NetApp FabricPool.* Cette fonctionnalité fournit une hiérarchisation automatique des données froides vers des options de stockage cloud publiques et privées, notamment Amazon Web Services (AWS), Azure et la solution de stockage NetApp StorageGRID . Pour plus d'informations sur FabricPool, voir"TR-4598" .
Accélérer et protéger les données
ONTAP 9 offre des niveaux supérieurs de performances et de protection des données et étend ces capacités des manières suivantes :
-
Performances et latence réduite. ONTAP offre le débit le plus élevé possible avec la latence la plus faible possible.
-
Protection des données. ONTAP fournit des fonctionnalités de protection des données intégrées avec une gestion commune sur toutes les plates-formes.
-
* Chiffrement de volume NetApp (NVE).* ONTAP offre un cryptage natif au niveau du volume avec prise en charge de la gestion des clés intégrée et externe.
-
Authentification multi-locataire et multifacteur. ONTAP permet le partage des ressources d'infrastructure avec les plus hauts niveaux de sécurité.
Une infrastructure à l'épreuve du temps
ONTAP 9 permet de répondre aux besoins commerciaux exigeants et en constante évolution grâce aux fonctionnalités suivantes :
-
Mise à l'échelle transparente et opérations non perturbatrices. ONTAP prend en charge l'ajout non perturbateur de capacité aux contrôleurs existants et aux clusters évolutifs. Les clients peuvent passer aux dernières technologies, telles que NVMe et FC 32 Go, sans migrations de données ni pannes coûteuses.
-
Connexion au Cloud. ONTAP est le logiciel de gestion de stockage le plus connecté au cloud, avec des options de stockage défini par logiciel (ONTAP Select) et des instances cloud natives (Google Cloud NetApp Volumes) dans tous les clouds publics.
-
Intégration avec les applications émergentes. ONTAP propose des services de données de niveau entreprise pour les plates-formes et applications de nouvelle génération, telles que les véhicules autonomes, les villes intelligentes et l'industrie 4.0, en utilisant la même infrastructure qui prend en charge les applications d'entreprise existantes.
NetApp SANtricity
NetApp SANtricity est conçu pour offrir des performances, une fiabilité et une simplicité de pointe aux baies hybrides Flash de la série E et aux baies entièrement Flash de la série EF. Bénéficiez de performances et d'une utilisation maximales de vos baies hybrides Flash de la série E et de vos baies entièrement Flash de la série EF pour les applications à charge de travail élevée, notamment l'analyse de données, la vidéosurveillance, la sauvegarde et la récupération. Avec SANtricity, les ajustements de configuration, la maintenance, l'extension de capacité et d'autres tâches peuvent être effectués pendant que le stockage reste en ligne. SANtricity offre également une protection supérieure des données, une surveillance proactive et une sécurité certifiée, le tout accessible via l'interface System Manager intégrée et facile à utiliser. Pour en savoir plus, consultez le "Fiche technique du logiciel SANtricity NetApp E-Series" .
Performances optimisées
Le logiciel SANtricity optimisé pour les performances fournit des données (avec des IOP élevées, un débit élevé et une faible latence) à toutes vos applications d'analyse de données, de vidéosurveillance et de sauvegarde. Accélérez les performances des applications à IOPS élevé et à faible latence et des applications à bande passante élevée et à débit élevé.
Maximiser la disponibilité
Effectuez toutes vos tâches de gestion pendant que le stockage reste en ligne. Ajustez les configurations, effectuez la maintenance ou augmentez la capacité sans perturber les E/S. Bénéficiez d'une fiabilité de premier ordre grâce à des fonctionnalités automatisées, une configuration en ligne, une technologie de pointe de pools de disques dynamiques (DPP) et bien plus encore.
Repose en paix
Le logiciel SANtricity offre une protection supérieure des données, une surveillance proactive et une sécurité certifiée, le tout via l'interface System Manager intégrée et facile à utiliser. Simplifiez les tâches de gestion du stockage. Bénéficiez de la flexibilité dont vous avez besoin pour un réglage avancé de tous les systèmes de stockage de la série E. Gérez votre système NetApp E-Series, à tout moment et en tout lieu. Notre interface Web intégrée rationalise votre flux de travail de gestion.
NetApp Trident
"Trident"de NetApp est un orchestrateur de stockage dynamique open source pour Docker et Kubernetes qui simplifie la création, la gestion et la consommation de stockage persistant. Trident, une application native Kubernetes, s'exécute directement dans un cluster Kubernetes. Trident permet aux clients de déployer de manière transparente des images de conteneurs DL sur le stockage NetApp et offre une expérience de niveau entreprise pour les déploiements de conteneurs IA. Les utilisateurs de Kubernetes (tels que les développeurs ML et les scientifiques des données) peuvent créer, gérer et automatiser l'orchestration et le clonage pour tirer parti des fonctionnalités avancées de gestion des données de NetApp optimisées par la technologie NetApp .
Copie et synchronisation NetApp BlueXP
"Copie et synchronisation BlueXP"est un service NetApp pour une synchronisation rapide et sécurisée des données. Que vous ayez besoin de transférer des fichiers entre des partages de fichiers NFS ou SMB sur site, NetApp StorageGRID, NetApp ONTAP S3, Google Cloud NetApp Volumes, Azure NetApp Files, Amazon Simple Storage Service (Amazon S3), Amazon Elastic File System (Amazon EFS), Azure Blob, Google Cloud Storage ou IBM Cloud Object Storage, BlueXP Copy and Sync déplace les fichiers là où vous en avez besoin rapidement et en toute sécurité. Une fois vos données transférées, elles sont entièrement disponibles pour une utilisation sur la source et la cible. BlueXP Copy and Sync synchronise en continu les données, en fonction de votre calendrier prédéfini, en déplaçant uniquement les deltas, de sorte que le temps et l'argent consacrés à la réplication des données sont minimisés. BlueXP Copy and Sync est un outil logiciel en tant que service (SaaS) extrêmement simple à configurer et à utiliser. Les transferts de données déclenchés par BlueXP Copy and Sync sont effectués par des courtiers de données. Vous pouvez déployer les courtiers de données BlueXP Copy and Sync dans AWS, Azure, Google Cloud Platform ou sur site.
Serveurs Lenovo ThinkSystem
Les serveurs Lenovo ThinkSystem sont dotés de matériel, de logiciels et de services innovants qui résolvent les défis actuels des clients et offrent une approche de conception modulaire, évolutive et adaptée aux besoins pour relever les défis de demain. Ces serveurs capitalisent sur les meilleures technologies standard de leur catégorie, associées aux innovations Lenovo différenciées pour offrir la plus grande flexibilité possible dans les serveurs x86.
Les principaux avantages du déploiement des serveurs Lenovo ThinkSystem incluent :
-
Des conceptions hautement évolutives et modulaires pour évoluer avec votre entreprise
-
Une résilience de pointe pour économiser des heures d'arrêts imprévus coûteux
-
Technologies flash rapides pour des latences plus faibles, des temps de réponse plus rapides et une gestion des données plus intelligente en temps réel
Dans le domaine de l’IA, Lenovo adopte une approche pratique pour aider les entreprises à comprendre et à adopter les avantages du ML et de l’IA pour leurs charges de travail. Les clients Lenovo peuvent explorer et évaluer les offres Lenovo AI dans les centres d'innovation Lenovo AI pour comprendre pleinement la valeur de leur cas d'utilisation particulier. Pour améliorer le délai de rentabilisation, cette approche centrée sur le client fournit aux clients une preuve de concept pour des plateformes de développement de solutions prêtes à l'emploi et optimisées pour l'IA.
Serveur Edge Lenovo ThinkSystem SE350
L'informatique de pointe permet d'analyser les données des appareils IoT à la périphérie du réseau avant d'être envoyées au centre de données ou au cloud. Le Lenovo ThinkSystem SE350, comme illustré dans la figure ci-dessous, est conçu pour répondre aux exigences uniques du déploiement en périphérie, en mettant l'accent sur la flexibilité, la connectivité, la sécurité et la gestion à distance dans un format compact, robuste et respectueux de l'environnement.
Doté du processeur Intel Xeon D avec la flexibilité nécessaire pour prendre en charge l'accélération des charges de travail d'IA de pointe, le SE350 est spécialement conçu pour relever le défi des déploiements de serveurs dans divers environnements en dehors du centre de données.


MLPerf
MLPerf est la suite de référence leader du secteur pour l'évaluation des performances de l'IA. Il couvre de nombreux domaines de l’IA appliquée, notamment la classification d’images, la détection d’objets, l’imagerie médicale et le traitement du langage naturel (NLP). Dans cette validation, nous avons utilisé les charges de travail Inference v0.7, qui est la dernière itération de l'inférence MLPerf à la fin de cette validation. Le "Inférence MLPerf v0.7" La suite comprend quatre nouveaux benchmarks pour les centres de données et les systèmes périphériques :
-
BERT. Représentation d'encodeur bidirectionnel à partir de transformateurs (BERT) affinée pour répondre aux questions en utilisant l'ensemble de données SQuAD.
-
DLRM. Le modèle de recommandation d'apprentissage profond (DLRM) est un modèle de personnalisation et de recommandation formé pour optimiser les taux de clics (CTR).
-
3D U-Net. L'architecture 3D U-Net est formée sur l'ensemble de données de segmentation des tumeurs cérébrales (BraTS).
-
RNN-T. Recurrent Neural Network Transducer (RNN-T) est un modèle de reconnaissance automatique de la parole (ASR) formé sur un sous-ensemble de LibriSpeech. Les résultats et le code d'inférence MLPerf sont accessibles au public et publiés sous licence Apache. MLPerf Inference dispose d'une division Edge, qui prend en charge les scénarios suivants :
-
Flux unique. Ce scénario imite les systèmes dans lesquels la réactivité est un facteur critique, comme les requêtes d’IA hors ligne effectuées sur les smartphones. Les requêtes individuelles sont envoyées au système et les temps de réponse sont enregistrés. Le 90e percentile de latence de toutes les réponses est indiqué comme résultat.
-
Multiflux. Cette référence est destinée aux systèmes qui traitent les entrées de plusieurs capteurs. Pendant le test, les requêtes sont envoyées à un intervalle de temps fixe. Une contrainte QoS (latence maximale autorisée) est imposée. Le test indique le nombre de flux que le système peut traiter tout en respectant la contrainte QoS.
-
Hors ligne. Il s’agit du scénario le plus simple couvrant les applications de traitement par lots et la mesure est le débit en échantillons par seconde. Toutes les données sont disponibles pour le système et le benchmark mesure le temps nécessaire pour traiter tous les échantillons.
Lenovo a publié les scores d'inférence MLPerf pour SE350 avec T4, le serveur utilisé dans ce document. Voir les résultats sur "https://mlperf.org/inference-results-0-7/" dans la section « Edge, Division fermée » dans l'entrée #0.7-145.