适用于 AI 的数据移动工具解决方案
适用于 AI 的数据移动工具解决方案基于客户处理 AI 操作中的 Hadoop 数据的需求。NetApp 使用 NIPAM 将数据从 HDFS 移动到 NFS 。在一个用例中、客户需要将数据移动到内部的NFS、而另一个客户则需要将数据从Windows Azure存储Blb移动到Google Cloud NetApp卷、以便处理云中GPU云实例中的数据。
下图显示了数据移动程序解决方案的详细信息。
要构建数据移动程序解决方案,需要执行以下步骤:
-
ONTAP SAN 可提供 HDFS , NAS 可通过 NIPAM 为生产数据湖集群提供 NFS 卷。
-
客户的数据位于 HDFS 和 NFS 中。NFS 数据可以是来自其他应用程序的生产数据,用于大数据分析和 AI 操作。
-
NetApp FlexClone 技术可创建生产 NFS 卷的克隆并将其配置到内部的 AI 集群。
-
使用 NIPAM 和
Hadoop distcp
命令将来自 HDFS SAN LUN 的数据复制到 NFS 卷中。NIPAM 使用多个网络接口的带宽传输数据。此过程可缩短数据复制时间,以便传输更多数据。 -
这两个 NFS 卷都配置到 AI 集群以执行 AI 操作。
-
要使用云中的 GPU 处理内部 NFS 数据, NFS 卷会采用 NetApp SnapMirror 技术镜像到 NetApp 私有存储( NPS ),并挂载到云服务提供商的 GPU 。
-
客户希望通过云服务提供商提供的 GPU 处理 EC2/EMR , HDInsight 或 DataProc 服务中的数据。Hadoop数据移动工具可使用NIPAM和命令将数据从Hadoop服务移动到Google Cloud NetApp卷
hadoop distcp
。 -
Google Cloud NetApp卷数据通过NFS协议配置到AI。通过AI处理的数据可以通过NIPAM、SnapMirror和NPS发送到NVIDIA集群中、并在内部位置进行大数据分析。
在这种情况下,客户在远程位置的 NAS 系统中有大量文件计数数据,这是在内部 NetApp 存储控制器上进行 AI 处理所需的。在这种情况下,最好使用 XCP 迁移工具以更快的速度迁移数据。
混合用例客户可以使用BlueXP Copy and Sync将内部数据从NFS、CIFS和S3数据迁移到云、反之亦然、以便通过NVIDIA集群中的GPU进行AI处理。BlueXP副本和同步以及XCP迁移工具均用于将NFS数据迁移到NetApp ONTAP NFS。