Skip to main content
NetApp Solutions
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Data fabric basato su NetApp per l'architettura dei big data

Collaboratori

Il data fabric basato su NetApp semplifica e integra la gestione dei dati in ambienti cloud e on-premise per accelerare la trasformazione digitale.

Il data fabric basato su NetApp offre servizi e applicazioni per la gestione dei dati coerenti e integrati (building block) per visibilità e approfondimenti dei dati, accesso e controllo dei dati, protezione e sicurezza dei dati, come mostrato nella figura seguente.

Figura che mostra la finestra di dialogo input/output o rappresenta il contenuto scritto

Casi di utilizzo comprovati per i clienti del data fabric

Il data fabric basato su NetApp offre ai clienti i seguenti nove casi di utilizzo comprovati:

  • Accelera i carichi di lavoro di analisi

  • Accelera la trasformazione DevOps

  • Costruire un'infrastruttura di cloud hosting

  • Integra i servizi dati cloud

  • Proteggere e proteggere i dati

  • Ottimizza i dati non strutturati

  • Ottieni efficienze nel data center

  • Offri informazioni e controllo sui dati

  • Semplifica e automatizza

Questo documento tratta due dei nove casi di utilizzo (insieme alle relative soluzioni):

  • Accelera i carichi di lavoro di analisi

  • Proteggere e proteggere i dati

Accesso diretto NetApp NFS

NFS NetApp consente ai clienti di eseguire job di analytics dei big data sui propri NFSv4 dati NFSv3 o nuovi, senza spostare o copiare i dati. Impedisce più copie di dati ed elimina la necessità di sincronizzare i dati con un'origine. Ad esempio, nel settore finanziario, lo spostamento dei dati da un luogo all'altro deve soddisfare obblighi legali, il che non è un compito facile. In questo scenario, l'accesso diretto NetApp NFS analizza i dati finanziari dalla posizione originale. Un altro vantaggio chiave è che l'utilizzo dell'accesso diretto NetApp NFS semplifica la protezione dei dati Hadoop utilizzando comandi Hadoop nativi e abilita i flussi di lavoro per la protezione dei dati sfruttando il ricco portfolio di gestione dei dati di NetApp.

Figura che mostra la finestra di dialogo input/output o rappresenta il contenuto scritto

L'accesso diretto NetApp NFS offre due tipi di opzioni di implementazione per i cluster Hadoop/Spark:

  • Per impostazione predefinita, i cluster Hadoop/Spark utilizzano Hadoop Distributed file System (HDFS) per lo storage dei dati e il file system predefinito. L'accesso diretto NetApp NFS può sostituire l'HDFS predefinito con lo storage NFS come file system predefinito, consentendo operazioni di analisi dirette sui dati NFS.

  • In un'altra opzione di implementazione, l'accesso diretto NetApp NFS supporta la configurazione di NFS come storage aggiuntivo insieme a HDFS in un singolo cluster Hadoop/Spark. In questo caso, il cliente può condividere i dati attraverso le esportazioni NFS e accedervi dallo stesso cluster insieme ai dati HDFS.

I vantaggi principali dell'utilizzo dell'accesso diretto NetApp NFS includono:

  • Analizza i dati dalla posizione corrente, impedendo il dispendio di tempo e performance dello spostamento dei dati di analisi in un'infrastruttura Hadoop come HDFS.

  • Riduce il numero di repliche da tre a uno.

  • Consente agli utenti di separare il calcolo e lo storage per scalare in modo indipendente.

  • Offre protezione dei dati aziendali sfruttando le funzionalità di gestione dei dati avanzate di ONTAP.

  • È certificato con la piattaforma dati Hortonworks.

  • Consente implementazioni di analisi dei dati ibride.

  • Riduce i tempi di backup sfruttando la funzionalità multithread dinamica.

Elementi di base per i big data

Il data fabric basato su NetApp integra i servizi e le applicazioni di gestione dei dati (building block) per l'accesso, il controllo, la protezione e la sicurezza dei dati, come mostrato nella figura seguente.

Figura che mostra la finestra di dialogo input/output o rappresenta il contenuto scritto

Gli elementi di base della figura precedente includono:

  • Accesso diretto NetApp NFS. offre i più recenti cluster Hadoop e Spark con accesso diretto ai volumi NetApp NFS senza requisiti aggiuntivi di software o driver.

  • NetApp Cloud Volumes ONTAP e Google Cloud NetApp Volumes. Storage connesso software-defined basato su ONTAP eseguito in Amazon Web Services (AWS) o Azure NetApp Files (ANF) nei servizi cloud Microsoft Azure.

  • Tecnologia NetApp SnapMirror. Offre funzionalità di protezione dei dati tra istanze cloud on-premise e ONTAP o NPS.

  • Cloud service provider. questi provider includono AWS, Microsoft Azure, Google Cloud e IBM Cloud.

  • PaaS. servizi di analisi basati sul cloud come Amazon Elastic MapReduce (EMR) e Databricks in AWS, Microsoft Azure HDInsight e Azure Databricks.