Skip to main content
NetApp artificial intelligence solutions
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

技术概述

本节概述了完成此解决方案所需的各种技术组件。

普罗托邦

Protopia AI 为当今市场上的机密推理提供了一种不引人注目的纯软件解决方案。 Protopia 解决方案通过最大限度地减少敏感信息的暴露,为推理服务提供了无与伦比的保护。人工智能仅接收数据记录中对于执行手头任务真正必要的信息,仅此而已。大多数推理任务不会使用每个数据记录中存在的所有信息。无论您的 AI 使用的是图像、语音、视频还是结构化表格数据,Protopia 都只提供推理服务所需的内容。该专利核心技术使用数学策划的噪声来随机转换数据并混淆给定 ML 服务不需要的信息。该解决方案不会掩盖数据;相反,它通过使用精选的随机噪声来改变数据表示。

Protopia 解决方案将改变表示的问题表述为基于梯度的扰动最大化方法,该方法仍然保留与模型功能相关的输入特征空间中的信息。此发现过程在训练 ML 模型结束时作为微调过程运行。在传递过程自动生成一组概率分布之后,低开销数据转换会将这些分布中的噪声样本应用于数据,并在将其传递给模型进行推理之前对其进行混淆。

NetApp ONTAP AI

NetApp ONTAP AI 参考架构由 DGX A100 系统和NetApp云连接存储系统提供支持,由NetApp和NVIDIA开发和验证。它为 IT 组织提供了一种具有以下优势的架构:

  • 消除设计复杂性

  • 允许独立扩展计算和存储

  • 支持客户从小规模起步,然后无缝扩展

  • 提供广泛的存储选项,以满足各种性价比需求

ONTAP AI 将 DGX A100 系统和NetApp AFF A800存储系统与最先进的网络紧密集成。 ONTAP AI 通过消除设计复杂性和猜测来简化 AI 部署。客户可以从小规模开始,然后无中断地发展,同时智能地管理从边缘到核心到云端再返回的数据。

下图显示了采用 DGX A100 系统的ONTAP AI 系列解决方案的几种变体。 AFF A800系统性能已通过最多八个 DGX A100 系统验证。通过向ONTAP集群添加存储控制器对,该架构可以扩展到多个机架,以支持许多 DGX A100 系统和具有线性性能的 PB 级存储容量。这种方法可以灵活地根据所使用的 DL 模型的大小和所需的性能指标独立地改变计算与存储的比率。

该图显示输入/输出对话框或表示书面内容

NetApp ONTAP

ONTAP 9.11 是NetApp最新一代存储管理软件,它支持企业实现基础架构现代化并过渡到云就绪数据中心。 ONTAP利用业界领先的数据管理功能,只需一套工具即可管理和保护数据,无论数据位于何处。您还可以将数据自由移动到任何需要的地方:边缘、核心或云端。 ONTAP 9.11 包含许多功能,可简化数据管理、加速和保护关键数据,并支持跨混合云架构的下一代基础架构功能。

NetApp DataOps 工具包

NetApp DataOps Toolkit 是一个 Python 库,可帮助开发人员、数据科学家、DevOps 工程师和数据工程师轻松执行各种数据管理任务,例如近乎即时地配置新的数据卷或 JupyterLab 工作区、近乎即时地克隆数据卷或 JupyterLab 工作区,以及近乎即时地拍摄数据卷或 JupyterLab 工作区的快照以进行可追溯性或基准测试。这个 Python 库可以作为命令行实用程序或函数库,您可以将其导入到任何 Python 程序或 Jupyter 笔记本中。

NVIDIA Triton 推理服务器

NVIDIA Triton 推理服务器是一款开源推理服务软件,可帮助标准化模型部署和执行,以在生产中提供快速且可扩展的 AI。 Triton Inference Server 通过使团队能够在任何基于 GPU 或 CPU 的基础架构上从任何框架部署、运行和扩展经过训练的 AI 模型,简化了 AI 推理。 Triton Inference Server 支持所有主流框架,例如 TensorFlow、 NVIDIA TensorRT、PyTorch、MXNet、OpenVINO 等。 Triton 与 Kubernetes 集成,可进行编排和扩展,您可以在所有主要的公共云 AI 和 Kubernetes 平台中使用它。它还与许多 MLOps 软件解决方案集成。

PyTorch

"PyTorch"是一个开源的 ML 框架。它是一个针对使用 GPU 和 CPU 的深度学习而优化的张量库。 PyTorch 包包含多维张量的数据结构,它提供了许多实用程序,用于高效序列化张量以及其他有用的实用程序。它还有一个 CUDA 对应物,使您能够在具有计算能力的NVIDIA GPU 上运行张量计算。在本次验证中,我们使用 OpenCV-Python (cv2) 库来验证我们的模型,同时利用 Python 最直观的计算机视觉概念。

简化数据管理

数据管理对于企业 IT 运营和数据科学家至关重要,以便将适当的资源用于 AI 应用程序和训练 AI/ML 数据集。以下有关NetApp技术的附加信息超出了本次验证的范围,但可能与您的部署相关。

ONTAP数据管理软件包括以下功能,可简化操作并降低总运营成本:

  • 内联数据压缩和扩展重复数据删除。数据压缩减少了存储块内部浪费的空间,重复数据删除显著增加了有效容量。这适用于本地存储的数据和分层到云的数据。

  • 最小、最大和自适应服务质量 (AQoS)。细粒度的服务质量 (QoS) 控制有助于维持高度共享环境中关键应用程序的性能水平。

  • NetApp FabricPool。提供冷数据自动分层到公共和私有云存储选项,包括 Amazon Web Services (AWS)、Azure 和NetApp StorageGRID存储解决方案。有关FabricPool的更多信息,请参阅 "TR-4598: FabricPool最佳实践"

加速并保护数据

ONTAP提供卓越级别的性能和数据保护,并通过以下方式扩展这些功能:

  • 性能和更低的延迟。 ONTAP以尽可能低的延迟提供尽可能高的吞吐量。

  • 数据保护。ONTAP提供内置数据保护功能,并在所有平台上提供通用管理。

  • NetApp卷加密 (NVE)。 ONTAP提供原生卷级加密,同时支持板载和外部密钥管理。

  • 多租户和多因素身份验证。 ONTAP支持以最高级别的安全性共享基础设施资源。

面向未来的基础设施

ONTAP具有以下功能,可帮助满足苛刻且不断变化的业务需求:

  • 无缝扩展和无中断运行。 ONTAP支持无中断地向现有控制器和横向扩展集群添加容量。客户可以升级到最新技术,例如 NVMe 和 32Gb FC,而无需昂贵的数据迁移或中断。

  • 云连接。 ONTAP是与云连接最紧密的存储管理软件,在所有公共云中均提供软件定义存储(ONTAP Select)和云原生实例(Google Cloud NetApp Volumes)的选项。

  • 与新兴应用程序的集成。 ONTAP使用支持现有企业应用的相同基础架构,为下一代平台和应用(如自动驾驶汽车、智能城市和工业 4.0)提供企业级数据服务。

NetApp Astra控制

NetApp Astra产品系列由NetApp存储和数据管理技术提供支持,为本地和公共云中的 Kubernetes 应用程序提供存储和应用程序感知数据管理服务。它使您能够轻松备份 Kubernetes 应用程序,将数据迁移到不同的集群,并立即创建可运行的应用程序克隆。如果您需要管理在公共云中运行的 Kubernetes 应用程序,请参阅 "Astra控制服务"。 Astra Control Service 是一项NetApp托管服务,可为 Google Kubernetes Engine (GKE) 和 Azure Kubernetes Service (AKS) 中的 Kubernetes 集群提供应用程序感知数据管理。

NetApp Trident

Astra "Trident"NetApp推出的一款适用于 Docker 和 Kubernetes 的开源动态存储编排器,可简化持久存储的创建、管理和使用。 Trident是一个 Kubernetes 原生应用程序,直接在 Kubernetes 集群中运行。 Trident使客户能够将 DL 容器映像无缝部署到NetApp存储上,并为 AI 容器部署提供企业级体验。 Kubernetes 用户(ML 开发人员、数据科学家等)可以创建、管理和自动化编排和克隆,以利用由NetApp技术提供支持的高级数据管理功能。

NetApp BlueXP复制和同步

"BlueXP复制和同步"是NetApp 的一项快速、安全的数据同步服务。无论您需要在本地 NFS 或 SMB 文件共享、 NetApp StorageGRID、 NetApp ONTAP S3、 Google Cloud NetApp Volumes、 Azure NetApp Files、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic File System (Amazon EFS)、Azure Blob、Google Cloud Storage 或 IBM Cloud Object Storage 之间传输文件, BlueXP Copy and Sync 都能快速安全地将文件移动到您需要的位置。数据传输完成后,可在源端和目标端完全使用。 BlueXP Copy 和 Syncc 根据您预先定义的计划持续同步数据,仅移动增量,从而最大限度地减少数据复制所花费的时间和金钱。 BlueXP Copy and Sync 是一种软件即服务 (SaaS) 工具,其设置和使用极其简单。 BlueXP Copy 和 Sync 触发的数据传输由数据代理执行。您可以在 AWS、Azure、Google Cloud Platform 或本地部署BlueXP Copy 和 Sync 数据代理。

NetApp BlueXP分类

在强大的AI算法驱动下, "NetApp BlueXP分类"为您的整个数据资产提供自动化控制和数据治理。您可以轻松找到节省成本的方法、识别合规性和隐私问题并找到优化机会。 BlueXP分类仪表板可让您洞察重复数据以消除冗余,映射个人、非个人和敏感数据,并针对敏感数据和异常情况发出警报。