Technologie de la solution
Cette solution utilise les technologies suivantes :
-
AWS SageMaker Notebook. offre des fonctionnalités de machine learning aux développeurs et aux data Scientists pour créer, entraîner et déployer efficacement des modèles DE ML de haute qualité.
-
NetApp BlueXP permet la détection, le déploiement et l'exploitation du stockage sur site ainsi que sur AWS, Azure et Google Cloud. Il offre une protection des données contre la perte de données, les cybermenaces et les pannes imprévues. Il optimise le stockage des données et l'infrastructure.
-
NetApp Cloud Volumes ONTAP. fournit des volumes de stockage haute performance avec les protocoles NFS, SMB/CIFS, iSCSI et S3 sur AWS, Azure et Google Cloud, ce qui confère une plus grande flexibilité à l'accès aux données et leur gestion dans le cloud.
NetApp Cloud Volumes ONTAP a été créé à partir de BlueXP pour stocker des données DE ML.
La figure suivante présente les composants techniques de la solution.
Récapitulatif du cas d'utilisation
L'accès double protocole NFS et S3 peut être utilisé dans les domaines du machine learning et de la data science. Par exemple, une équipe de data Scientists peut travailler sur un projet de machine learning à l'aide d'AWS SageMaker qui requiert l'accès aux données stockées au format NFS. Cependant, il peut également être nécessaire d'accéder aux données et de les partager via des compartiments S3 pour collaborer avec d'autres membres de l'équipe ou pour les intégrer avec d'autres applications qui utilisent S3.
Avec NetApp Cloud Volumes ONTAP, l'équipe peut stocker ses données dans un emplacement unique et les rendre accessibles via les protocoles NFS et S3. Les data Scientists peuvent accéder aux données au format NFS directement à partir d'AWS SageMaker, tandis que les autres membres de l'équipe ou applications peuvent accéder aux mêmes données via des compartiments S3.
Cette approche permet d'accéder aux données et de les partager facilement et efficacement, sans avoir à migrer des logiciels ou des données supplémentaires entre différentes solutions de stockage. Elle permet également de rationaliser le workflow et la collaboration entre les membres de l'équipe afin de développer plus rapidement et plus efficacement des modèles de machine learning.