Lösungstechnologie
Diese Lösung verwendet die folgenden Technologien:
-
AWS SageMaker Notebook. bietet Entwicklern und Data Scientists Machine-Learning-Funktionen, um hochwertige ML-Modelle effizient zu erstellen, zu trainieren und bereitzustellen.
-
NetApp BlueXP. ermöglicht das Erkennen, Implementieren und Betreiben von Storage sowohl vor Ort als auch auf AWS, Azure und Google Cloud. Sie bietet Datensicherung gegen Datenverlust, Cyberbedrohungen und ungeplante Ausfälle und optimiert Storage und Infrastruktur.
-
NetApp Cloud Volumes ONTAP. bietet Storage Volumes der Enterprise-Klasse mit NFS-, SMB/CIFS-, iSCSI- und S3-Protokollen auf AWS, Azure und Google Cloud, was Benutzern mehr Flexibilität beim Zugriff auf und Management ihrer Daten in der Cloud gibt.
Aus BlueXP erstellte NetApp Cloud Volumes ONTAP zur Speicherung VON ML-Daten
In der folgenden Abbildung sind die technischen Komponenten der Lösung dargestellt.
Zusammenfassung des Anwendungsfalls
Ein möglicher Anwendungsfall für den dualen Protokollzugriff von NFS und S3 liegt im Bereich Machine Learning und Data Science. Beispielsweise arbeitet ein Team aus Datenanalysten möglicherweise an einem Machine Learning-Projekt, bei dem AWS SageMaker verwendet wird. Hierfür ist der Zugriff auf die im NFS-Format gespeicherten Daten erforderlich. Unter Umständen müssen die Daten aber auch über S3 Buckets abgerufen und für die Zusammenarbeit mit anderen Teammitgliedern oder zur Integration in andere Applikationen, die S3 verwenden, freigegeben werden.
Durch den Einsatz von NetApp Cloud Volumes ONTAP kann das Team die Daten an einem zentralen Speicherort speichern und sowohl mit NFS- als auch mit S3-Protokollen darauf zugreifen. Die Data Scientists können direkt aus AWS SageMaker auf die Daten im NFS-Format zugreifen, während andere Teammitglieder oder Applikationen über S3-Buckets auf dieselben Daten zugreifen.
Bei diesem Ansatz ist ein einfacher und effizienter Zugriff auf die Daten möglich, ohne dass zusätzliche Software oder eine Datenmigration zwischen verschiedenen Storage-Lösungen erforderlich ist. Außerdem werden der Workflow und die Zusammenarbeit zwischen den Teammitgliedern optimiert, was zu einer schnelleren und effektiveren Entwicklung von Machine-Learning-Modellen führt.