Aperçu de la technologie
Cette section présente plus en détail les principaux composants de cette solution.
Systèmes NetApp AFF
Les systèmes de stockage NetApp AFF permettent aux entreprises de répondre aux exigences de stockage d'entreprise avec des performances de pointe, une flexibilité supérieure, une intégration cloud et une gestion des données de premier ordre. Conçus spécifiquement pour le flash, les systèmes AFF aident à accélérer, gérer et protéger les données critiques de l'entreprise.
NetApp AFF A400 est un système de stockage flash NVMe de milieu de gamme qui comprend les fonctionnalités suivantes :
-
Capacité effective maximale : ~20 Po
-
Évolutivité maximale : 2 à 24 nœuds (12 paires HA)
-
Prise en charge des hôtes FC 25 GbE et 16 Gb
-
Connectivité RDMA 100 GbE sur Ethernet convergé (RoCE) vers les étagères de stockage d'extension NVMe
-
Les ports RoCE 100 GbE peuvent être utilisés pour la connexion au réseau hôte si les étagères NVMe ne sont pas connectées
-
Étagères de stockage d'extension de connectivité SAS 12 Gbit/s complètes
-
Disponible en deux configurations :
-
Ethernet : 4 ports Ethernet 25 Gb (SFP28)
-
Fibre Channel : 4 ports FC 16 Go (SFP+)
-
-
Lecture aléatoire à 100 % de 8 Ko à 0,4 ms, 400 000 IOPS
Les fonctionnalités de NetApp AFF A250 pour les déploiements IA/ML d'entrée de gamme incluent les suivantes :
-
Capacité effective maximale : 35 Po
-
Échelle maximale : 2 à 24 nœuds (12 paires HA)
-
440 000 IOPS en lectures aléatoires à 1 ms
-
Construit sur la dernière version de NetApp ONTAP ONTAP 9.8 ou ultérieure
-
Deux ports Ethernet 25 Gb pour l'interconnexion HA et cluster
NetApp propose également d'autres systèmes de stockage, tels que l' AFF A800 et AFF A700, qui offrent des performances et une évolutivité supérieures pour les déploiements d'IA/ML à plus grande échelle.
NetApp ONTAP
ONTAP 9, la dernière génération de logiciel de gestion du stockage de NetApp, permet aux entreprises de moderniser leur infrastructure et de passer à un centre de données prêt pour le cloud. En s'appuyant sur des capacités de gestion de données de pointe, ONTAP permet la gestion et la protection des données avec un seul ensemble d'outils, quel que soit l'endroit où résident ces données. Les données peuvent également être déplacées librement là où elles sont nécessaires : vers la périphérie, le cœur ou le cloud. ONTAP 9 inclut de nombreuses fonctionnalités qui simplifient la gestion des données, accélèrent et protègent les données critiques et garantissent une infrastructure pérenne dans les architectures de cloud hybride.
Simplifier la gestion des données
La gestion des données est essentielle aux opérations informatiques de l’entreprise afin que les ressources appropriées soient utilisées pour les applications et les ensembles de données. ONTAP inclut les fonctionnalités suivantes pour rationaliser et simplifier les opérations et réduire le coût total d'exploitation :
-
Compactage des données en ligne et déduplication étendue. La compaction des données réduit l’espace gaspillé à l’intérieur des blocs de stockage et la déduplication augmente considérablement la capacité effective. Cela s’applique aux données stockées localement et aux données hiérarchisées vers le cloud.
-
Qualité de service (QoS) minimale, maximale et adaptative. Les contrôles QoS granulaires aident à maintenir les niveaux de performances des applications critiques dans les environnements hautement partagés.
-
* ONTAP FabricPool.* Cette fonctionnalité hiérarchise automatiquement les données froides vers des options de stockage cloud publiques et privées, notamment Amazon Web Services (AWS), Azure et le stockage d'objets NetApp StorageGRID .
Accélérer et protéger les données
ONTAP offre des niveaux supérieurs de performance et de protection des données et étend ces capacités des manières suivantes :
-
Performances et latence réduite. ONTAP offre le débit le plus élevé possible avec la latence la plus faible possible.
-
Protection des données. ONTAP fournit des fonctionnalités de protection des données intégrées avec une gestion commune sur toutes les plates-formes.
-
* Chiffrement de volume NetApp .* ONTAP offre un cryptage natif au niveau du volume avec prise en charge de la gestion des clés intégrée et externe.
Une infrastructure à l'épreuve du temps
ONTAP 9 permet de répondre aux besoins métiers exigeants et en constante évolution :
-
Mise à l'échelle transparente et opérations non perturbatrices. ONTAP prend en charge l'ajout non perturbateur de capacité aux contrôleurs existants ainsi qu'aux clusters évolutifs. Les clients peuvent passer aux dernières technologies, telles que NVMe et FC 32 Go, sans migrations de données ni pannes coûteuses.
-
Connexion au Cloud. ONTAP est le logiciel de gestion de stockage le plus connecté au cloud, avec des options de stockage défini par logiciel (ONTAP Select) et des instances cloud natives (Google Cloud NetApp Volumes) dans tous les clouds publics.
-
Intégration avec les applications émergentes. ONTAP propose des services de données de niveau entreprise pour les plates-formes et applications de nouvelle génération telles qu'OpenStack, Hadoop et MongoDB en utilisant la même infrastructure qui prend en charge les applications d'entreprise existantes.
Volumes NetApp FlexGroup
Les ensembles de données de formation sont généralement une collection de milliards de fichiers potentiels. Les fichiers peuvent inclure du texte, de l'audio, de la vidéo et d'autres formes de données non structurées qui doivent être stockées et traitées pour être lues en parallèle. Le système de stockage doit stocker de nombreux petits fichiers et doit lire ces fichiers en parallèle pour les E/S séquentielles et aléatoires.
Un volume FlexGroup (figure suivante) est un espace de noms unique composé de plusieurs volumes membres constitutifs qui est géré et agit comme un FlexVol volume NetApp FlexVol pour les administrateurs de stockage. Les fichiers d'un volume FlexGroup sont alloués à des volumes membres individuels et ne sont pas répartis sur des volumes ou des nœuds. Ils permettent les capacités suivantes :
-
Jusqu'à 20 pétaoctets de capacité et une faible latence prévisible pour les charges de travail à métadonnées élevées
-
Jusqu'à 400 milliards de fichiers dans le même espace de noms
-
Opérations parallélisées dans les charges de travail NAS sur les processeurs, les nœuds, les agrégats et les volumes FlexVol constitutifs
Gamme Lenovo ThinkSystem
Les serveurs Lenovo ThinkSystem sont dotés de matériel, de logiciels et de services innovants qui résolvent les défis actuels des clients et offrent une approche de conception modulaire, évolutive et adaptée aux besoins pour relever les défis de demain. Ces serveurs capitalisent sur les meilleures technologies standard de leur catégorie, associées aux innovations Lenovo différenciées pour offrir la plus grande flexibilité possible dans les serveurs x86.
Les principaux avantages du déploiement des serveurs Lenovo ThinkSystem sont les suivants :
-
Des conceptions hautement évolutives et modulaires qui évoluent avec votre entreprise
-
Une résilience de pointe pour économiser des heures d'arrêts imprévus coûteux
-
Technologies flash rapides pour des latences plus faibles, des temps de réponse plus rapides et une gestion des données plus intelligente en temps réel
Dans le domaine de l’IA, Lenovo adopte une approche pratique pour aider les entreprises à comprendre et à adopter les avantages du ML et de l’IA pour leurs charges de travail. Les clients Lenovo peuvent explorer et évaluer les offres Lenovo AI dans les centres d'innovation Lenovo AI pour comprendre pleinement la valeur de leur cas d'utilisation particulier. Pour améliorer le délai de rentabilisation, cette approche centrée sur le client fournit aux clients des preuves de concept pour des plateformes de développement de solutions prêtes à l'emploi et optimisées pour l'IA.
Lenovo SR670 V2
Le serveur rack Lenovo ThinkSystem SR670 V2 offre des performances optimales pour l'IA accélérée et le calcul haute performance (HPC). Prenant en charge jusqu'à huit GPU, le SR670 V2 est adapté aux exigences de charge de travail intensives en calcul du ML, du DL et de l'inférence.
Avec les derniers processeurs Intel Xeon évolutifs prenant en charge les GPU haut de gamme (y compris le GPU NVIDIA A100 80 Go PCIe 8x), le ThinkSystem SR670 V2 offre des performances optimisées et accélérées pour les charges de travail d'IA et de HPC.
Étant donné que davantage de charges de travail utilisent les performances des accélérateurs, la demande de densité GPU a augmenté. Des secteurs tels que la vente au détail, les services financiers, l’énergie et la santé utilisent des GPU pour extraire de meilleures informations et stimuler l’innovation grâce aux techniques de ML, de DL et d’inférence.
Le ThinkSystem SR670 V2 est une solution optimisée de niveau entreprise pour le déploiement de charges de travail HPC et IA accélérées en production, maximisant les performances du système tout en maintenant la densité du centre de données pour les clusters de supercalcul avec des plates-formes de nouvelle génération.
Les autres fonctionnalités incluent :
-
Prise en charge des E/S RDMA directes du GPU dans lesquelles les adaptateurs réseau haut débit sont directement connectés aux GPU pour maximiser les performances d'E/S.
-
Prise en charge du stockage direct GPU dans lequel les disques NVMe sont directement connectés aux GPU pour maximiser les performances de stockage.
MLPerf
MLPerf est la suite de référence leader du secteur pour l'évaluation des performances de l'IA. Dans cette validation, nous avons utilisé son benchmark de classification d'images avec MXNet, l'un des frameworks d'IA les plus populaires. Le script de formation MXNet_benchmarks a été utilisé pour piloter la formation de l'IA. Le script contient des implémentations de plusieurs modèles conventionnels populaires et est conçu pour être aussi rapide que possible. Il peut être exécuté sur une seule machine ou exécuté en mode distribué sur plusieurs hôtes.