Anwendungsfall 4: Datensicherung und Multi-Cloud-Konnektivität
Beitragende
Dieser Anwendungsfall ist relevant für einen Cloud-Service-Partner, der für Multi-Cloud-Konnektivität für Big-Data-Analysedaten von Kunden steht.
Szenario
In diesem Szenario werden die in AWS empfangenen IoT-Daten aus verschiedenen Quellen an einem zentralen Standort in NPS gespeichert. Der NPS Storage ist mit Spark/Hadoop Clustern in AWS und Azure verbunden, sodass Big-Data-Analyseapplikationen in diversen Clouds ausgeführt werden und auf dieselben Daten zugreifen können.
Anforderungen und Herausforderungen zu bewältigen
Zu den wesentlichen Anforderungen und Herausforderungen dieses Anwendungsfalls gehören:
-
Kunden möchten Analysejobs in denselben Daten mithilfe mehrerer Clouds ausführen.
-
Daten müssen von unterschiedlichen Quellen wie On-Premises und Cloud über verschiedene Sensoren und Hubs empfangen werden.
-
Die Lösung muss effizient und kostengünstig sein.
-
Die größte Herausforderung ist der Aufbau einer kostengünstigen und effizienten Lösung, die hybride Analyseservices zwischen On-Premises-Systemen und verschiedenen Clouds bereitstellt.
Nutzen
Dieses Bild zeigt die Datensicherungs- und Multi-Cloud-Konnektivitätslösung.
Wie in der Abbildung oben gezeigt, werden die Daten von Sensoren gestreamt und über Kafka in den AWS Spark-Cluster aufgenommen. Die Daten werden in einem NFS-Share in NPS gespeichert, der sich außerhalb des Cloud-Providers in einem Equinix Datacenter befindet. Da NetApp NPS über Direct Connect und Express Route Verbindungen mit Amazon AWS und Microsoft Azure verbunden ist, können Kunden das in-Place-Analysemodul für den Zugriff auf Daten von Amazon- und AWS-Analyse-Clustern nutzen. Dieser Ansatz ist die Lösung dafür, dass Cloud-Analysen über mehrere Hyperscaler hinweg durchgeführt werden können.
Da sowohl On-Premises- als auch NPS-Storage auf ONTAP Software ausgeführt werden, kann SnapMirror die NPS Daten in das On-Premises-Cluster spiegeln. Dadurch profitieren Hybrid-Cloud-Analysen von On-Premises-Systemen und mehreren Clouds.
Um die beste Performance zu erzielen, empfiehlt NetApp normalerweise, mehrere Netzwerkschnittstellen und direkte Verbindungs-/Express-Routen zu verwenden, um auf die Daten von Cloud-Instanzen zuzugreifen.