Skip to main content
NetApp artificial intelligence solutions
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

HDFS e MapR-FS su ONTAP NFS

Per questa soluzione, NetApp ha convalidato la migrazione dei dati dal data lake (HDFS) e dai dati del cluster MapR a ONTAP NFS. I dati risiedevano in MapR-FS e HDFS. NetApp XCP ha introdotto una nuova funzionalità che migra direttamente i dati da un file system distribuito come HDFS e MapR-FS a ONTAP NFS. XCP utilizza thread asincroni e chiamate API C HDFS per comunicare e trasferire dati da MapR-FS e HDFS.

La figura seguente mostra la migrazione dei dati dal data lake (HDFS) e MapR-FS a ONTAP NFS. Grazie a questa nuova funzionalità, non è più necessario esportare la sorgente come condivisione NFS.

Figura che mostra il dialogo di input/output o che rappresenta il contenuto scritto

Perché i clienti stanno passando da HDFS e MapR-FS a NFS?

La maggior parte delle distribuzioni Hadoop, come Cloudera e Hortonworks, utilizzano HDFS, mentre le distribuzioni MapR utilizzano il proprio file system denominato Mapr-FS per archiviare i dati. I dati HDFS e MapR-FS forniscono agli scienziati dei dati informazioni preziose che possono essere sfruttate nell'apprendimento automatico (ML) e nell'apprendimento profondo (DL). I dati in HDFS e MapR-FS non sono condivisi, il che significa che non possono essere utilizzati da altre applicazioni. I clienti sono alla ricerca di dati condivisi, in particolare nel settore bancario, dove i dati sensibili dei clienti vengono utilizzati da più applicazioni. L'ultima versione di Hadoop (3.x o successiva) supporta l'origine dati NFS, a cui è possibile accedere senza software di terze parti aggiuntivo. Con la nuova funzionalità NetApp XCP, i dati possono essere spostati direttamente da HDFS e MapR-FS a NetApp NFS per fornire accesso a più applicazioni

Sono stati eseguiti test in Amazon Web Services (AWS) per trasferire i dati da MapR-FS a NFS per il test iniziale delle prestazioni con 12 nodi MAPR e 4 server NFS.

Quantità Misurare CPU virtuale Memoria Magazzinaggio Rete

server NFS

4

i3en.24xlarge

96

488GiB

8x SSD NVMe 7500

100

Nodi MapR

12

I3en.12xlarge

48

384GiB

4x SSD NVMe 7500

50

Sulla base dei test iniziali, abbiamo ottenuto una velocità di trasmissione di 20 GBps e siamo riusciti a trasferire 2 PB di dati al giorno.

Per ulteriori informazioni sulla migrazione dei dati HDFS senza esportare HDFS in NFS, vedere la sezione "Fasi di distribuzione - NAS" in"TR-4863: TR-4863: Linee guida sulle best practice per NetApp XCP - Data Mover, migrazione file e analisi" .