Skip to main content
NetApp Solutions
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

NetApp 为大数据架构提供支持的 Data Fabric

贡献者

由 NetApp 提供支持的 Data Fabric 可简化并集成云环境和内部环境中的数据管理,以加速数字化转型。

由 NetApp 提供支持的 Data Fabric 可提供一致且集成的数据管理服务和应用程序(组件),以实现数据可见性和洞察力,数据访问和控制以及数据保护和安全,如下图所示。

图中显示了输入/输出对话框或表示已写入内容

经验证的 Data Fabric 客户用例

由 NetApp 提供支持的 Data Fabric 为客户提供了以下九个经验证的使用情形:

  • 加快分析工作负载的速度

  • 加快开发运营转型

  • 构建云托管基础架构

  • 集成云数据服务

  • 保护和保护数据

  • 优化非结构化数据

  • 提高数据中心效率

  • 提供数据洞察力和控制力

  • 简化和自动化

本文档涵盖九个使用情形中的两个(及其解决方案):

  • 加快分析工作负载的速度

  • 保护和保护数据

NetApp NFS 直接访问

借助NetApp NFS、客户可以对现有或新的NFSv3或NFSv4数据运行大数据分析作业、而无需移动或复制数据。它可以防止多个数据副本,并且无需将数据与源进行同步。例如,在金融领域,将数据从一个位置移动到另一个位置必须履行法律义务,这不是一项容易的任务。在这种情况下, NetApp NFS 直接访问会分析其原始位置的财务数据。另一个主要优势是,使用 NetApp NFS 直接访问可通过使用原生 Hadoop 命令简化对 Hadoop 数据的保护,并利用 NetApp 丰富的数据管理产品组合支持数据保护工作流。

图中显示了输入/输出对话框或表示已写入内容

NetApp NFS 直接访问为 Hadoop/Spark 集群提供了两种部署选项:

  • 默认情况下, Hadoop/Spark 集群使用 Hadoop 分布式文件系统( HDFS )进行数据存储和默认文件系统。NetApp NFS 直接访问可以将默认 HDFS 替换为 NFS 存储作为默认文件系统,从而对 NFS 数据执行直接分析操作。

  • 在另一种部署选项中, NetApp NFS 直接访问支持在一个 Hadoop/Spark 集群中将 NFS 与 HDFS 配置为额外的存储。在这种情况下,客户可以通过 NFS 导出共享数据,并从同一集群访问数据以及 HDFS 数据。

使用 NetApp NFS 直接访问的主要优势包括:

  • 分析当前位置的数据,防止执行将分析数据移动到 HDFS 等 Hadoop 基础架构这一耗时且性能极高的任务。

  • 将副本数量从三个减少为一个。

  • 支持用户分离计算和存储,以便独立扩展。

  • 利用 ONTAP 丰富的数据管理功能提供企业数据保护。

  • 已通过 Hortonworks 数据平台认证。

  • 支持混合数据分析部署。

  • 利用动态多线程功能缩短备份时间。

大数据的组件

由 NetApp 提供支持的 Data Fabric 集成了数据管理服务和应用程序(组件),用于实现数据访问,控制,保护和安全性,如下图所示。

图中显示了输入/输出对话框或表示已写入内容

上图中的组件包括:

  • * NetApp NFS 直接访问。 * 为最新的 Hadoop 和 Spark 集群提供对 NetApp NFS 卷的直接访问,而无需额外的软件或驱动程序要求。

  • * NetApp Cloud Volumes ONTAP和Google Cloud NetApp Volumes*基于在Amazon Web Services (AWS)中运行的ONTAP或Microsoft Azure云服务中运行的Azure NetApp Files (ANF)的软件定义的连接存储。

  • * NetApp SnapMirror 技术 * 。在内部部署和 ONTAP 云或 NPS 实例之间提供数据保护功能。

  • * 云服务提供商。 * 这些提供商包括 AWS , Microsoft Azure , Google Cloud 和 IBM Cloud 。

  • * PaaaS 。 * 基于云的分析服务,例如 AWS 中的 Amazon Elastic MapReduce ( EMR )和 Databricks 以及 Microsoft Azure HDInsight 和 Azure Databricks 。