简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。
Hadoop 数据保护和NetApp
Hadoop DistCp 是一个用于大型集群间和集群内复制的本机工具。下图所示的 Hadoop DistCp 基本流程是一个典型的备份工作流,使用 MapReduce 等 Hadoop 原生工具将 Hadoop 数据从 HDFS 源复制到相应的目标。
NetApp NFS 直接访问使客户能够将 NFS 设置为 Hadoop DistCp 工具的目标位置,以便通过 MapReduce 将数据从 HDFS 源复制到 NFS 共享中。 NetApp NFS 直接访问充当 DistCp 工具的 NFS 驱动程序。