Skip to main content
NetApp Solutions
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Solution de transfert de données

Contributeurs

Dans un cluster Big Data, les données sont stockées dans les systèmes HDFS ou HCFS, par exemple MapR-FS, Windows Azure Storage Blob, S3 ou le système de fichiers Google. Nous avons effectué des tests avec HDFS, MapR-FS et S3, afin de copier les données vers l'exportation NFS NetApp ONTAP à l'aide du protocole NIPAM hadoop distcp commande à partir de la source.

Le diagramme suivant illustre le déplacement type des données d'un cluster Spark doté d'un système de stockage HDFS vers un volume NFS NetApp ONTAP, afin que NVIDIA puisse traiter les opérations d'IA.

Figure montrant la boîte de dialogue entrée/sortie ou représentant le contenu écrit

Le hadoop distcp La commande utilise le programme MapReduce pour copier les données. NIPAM fonctionne avec MapReduce pour servir de pilote au cluster Hadoop lors de la copie de données. NIPAM peut distribuer une charge sur plusieurs interfaces réseau pour une exportation unique. Ce processus optimise le débit du réseau en répartissant les données sur plusieurs interfaces réseau lorsque vous copiez les données de HDFS ou HCFS sur NFS.

Remarque NIPAM n'est pas pris en charge ni certifié avec MapR.