Data fabric basato su NetApp per l'architettura dei big data
Il data fabric basato su NetApp semplifica e integra la gestione dei dati in ambienti cloud e on-premise per accelerare la trasformazione digitale.
Il data fabric basato su NetApp offre servizi e applicazioni per la gestione dei dati coerenti e integrati (building block) per visibilità e approfondimenti dei dati, accesso e controllo dei dati, protezione e sicurezza dei dati, come mostrato nella figura seguente.
Casi di utilizzo comprovati per i clienti del data fabric
Il data fabric basato su NetApp offre ai clienti i seguenti nove casi di utilizzo comprovati:
-
Accelera i carichi di lavoro di analisi
-
Accelera la trasformazione DevOps
-
Costruire un'infrastruttura di cloud hosting
-
Integra i servizi dati cloud
-
Proteggere e proteggere i dati
-
Ottimizza i dati non strutturati
-
Ottieni efficienze nel data center
-
Offri informazioni e controllo sui dati
-
Semplifica e automatizza
Questo documento tratta due dei nove casi di utilizzo (insieme alle relative soluzioni):
-
Accelera i carichi di lavoro di analisi
-
Proteggere e proteggere i dati
Accesso diretto NetApp NFS
NFS NetApp consente ai clienti di eseguire job di analytics dei big data sui propri NFSv4 dati NFSv3 o nuovi, senza spostare o copiare i dati. Impedisce più copie di dati ed elimina la necessità di sincronizzare i dati con un'origine. Ad esempio, nel settore finanziario, lo spostamento dei dati da un luogo all'altro deve soddisfare obblighi legali, il che non è un compito facile. In questo scenario, l'accesso diretto NetApp NFS analizza i dati finanziari dalla posizione originale. Un altro vantaggio chiave è che l'utilizzo dell'accesso diretto NetApp NFS semplifica la protezione dei dati Hadoop utilizzando comandi Hadoop nativi e abilita i flussi di lavoro per la protezione dei dati sfruttando il ricco portfolio di gestione dei dati di NetApp.
L'accesso diretto NetApp NFS offre due tipi di opzioni di implementazione per i cluster Hadoop/Spark:
-
Per impostazione predefinita, i cluster Hadoop/Spark utilizzano Hadoop Distributed file System (HDFS) per lo storage dei dati e il file system predefinito. L'accesso diretto NetApp NFS può sostituire l'HDFS predefinito con lo storage NFS come file system predefinito, consentendo operazioni di analisi dirette sui dati NFS.
-
In un'altra opzione di implementazione, l'accesso diretto NetApp NFS supporta la configurazione di NFS come storage aggiuntivo insieme a HDFS in un singolo cluster Hadoop/Spark. In questo caso, il cliente può condividere i dati attraverso le esportazioni NFS e accedervi dallo stesso cluster insieme ai dati HDFS.
I vantaggi principali dell'utilizzo dell'accesso diretto NetApp NFS includono:
-
Analizza i dati dalla posizione corrente, impedendo il dispendio di tempo e performance dello spostamento dei dati di analisi in un'infrastruttura Hadoop come HDFS.
-
Riduce il numero di repliche da tre a uno.
-
Consente agli utenti di separare il calcolo e lo storage per scalare in modo indipendente.
-
Offre protezione dei dati aziendali sfruttando le funzionalità di gestione dei dati avanzate di ONTAP.
-
È certificato con la piattaforma dati Hortonworks.
-
Consente implementazioni di analisi dei dati ibride.
-
Riduce i tempi di backup sfruttando la funzionalità multithread dinamica.
Elementi di base per i big data
Il data fabric basato su NetApp integra i servizi e le applicazioni di gestione dei dati (building block) per l'accesso, il controllo, la protezione e la sicurezza dei dati, come mostrato nella figura seguente.
Gli elementi di base della figura precedente includono:
-
Accesso diretto NetApp NFS. offre i più recenti cluster Hadoop e Spark con accesso diretto ai volumi NetApp NFS senza requisiti aggiuntivi di software o driver.
-
NetApp Cloud Volumes ONTAP e Google Cloud NetApp Volumes. Storage connesso software-defined basato su ONTAP eseguito in Amazon Web Services (AWS) o Azure NetApp Files (ANF) nei servizi cloud Microsoft Azure.
-
Tecnologia NetApp SnapMirror. Offre funzionalità di protezione dei dati tra istanze cloud on-premise e ONTAP o NPS.
-
Cloud service provider. questi provider includono AWS, Microsoft Azure, Google Cloud e IBM Cloud.
-
PaaS. servizi di analisi basati sul cloud come Amazon Elastic MapReduce (EMR) e Databricks in AWS, Microsoft Azure HDInsight e Azure Databricks.