Skip to main content
NetApp Solutions
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

NetApp的开源MLOps

贡献者

Mike Oglesby、NetApp Sufian Ahmad、NetApp Rick Huang、NetApp Mohan Acharya、NetApp

各行各业、各种规模的公司和组织都在转向人工智能(AI)来解决实际问题、提供创新产品和服务、并在竞争日益激烈的市场中占据优势。许多企业纷纷转向开源MLOps工具、以跟上行业创新的快速步伐。这些开源工具可提供高级功能和尖端功能、但通常不考虑数据可用性和数据安全性。遗憾的是、这意味着技能娴熟的数据科学家不得不花费大量时间等待数据访问或等待完成与数据相关的基本操作。通过将常用开源MLOps工具与NetApp的智能数据基础架构相结合、企业可以加快数据管道的速度、进而加快AI计划的速度。他们可以从数据中释放价值、同时确保数据始终受到保护和安全。该解决方案演示了NetApp数据管理功能与多种常用开源工具和框架的配对、以应对这些挑战。

以下列表重点介绍了此解决方案支持的一些关键功能:

  • 用户可以快速配置新的高容量数据卷和开发工作空间、这些数据卷和工作空间由高性能横向扩展NetApp存储提供支持。

  • 用户可以近乎瞬时地克隆高容量数据卷和开发工作空间、以便进行实验或快速迭代。

  • 用户可以近乎瞬时地为高容量数据卷和开发工作空间保存快照、以便进行备份和/或可追溯性/基线化。

图中显示了输入/输出对话框或表示已写入内容

典型的MLOps工作流包含开发工作空间、通常采用以下形式: "Jupyter笔记本电脑";实验跟踪;自动化训练管道;数据管道;以及推入/部署。本解决方案重点介绍了几种不同的工具和框架、这些工具和框架可独立使用、也可结合使用来处理工作流的不同方面。此外、我们还演示了NetApp数据管理功能与其中每种工具的配对情况。该解决方案旨在提供一些组件、组织可以利用这些组件构建针对其使用情形和要求的自定义MLOps工作流。

此解决方案涵盖以下工具/框架:

以下列表介绍了单独或结合使用这些工具的常见部署模式。

  • 同时部署JupyterHub、MLflow和Apache Airflow—适用于的JupyterHub、用于 "Jupyter笔记本电脑"实验跟踪的MLflow以及用于自动化训练和数据管道的Apache Airflow。

  • 同时部署Kubeflow和Apache Airflow—适用于的Kubeflow "Jupyter笔记本电脑"、实验跟踪、自动化训练管道和推导;以及适用于数据管道的Apache Airflow。

  • 将Kubeflow部署为一体化MLOps平台解决方案、用于 "Jupyter笔记本电脑"、实验跟踪、自动化训练和数据管道以及推入。