简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。
AI Data Engine 的数据到 RAG 快速入门
使用此工作流从新部署的 AI Data Engine (AIDE) 系统转到工作检索增强生成 (RAG) 端点。了解存储管理员、数据工程师和数据科学家如何使用 ONTAP System Manager 和 AIDE Console 进行协作。
开始之前
-
您已安装数据计算节点 (DCN) 并将其添加到 ONTAP 集群。
-
您已经安装并许可了用于矢量化和护栏的 AI Data Engine software。
-
您已配置 "OpenID Connect (OIDC)" 并映射了管理员、数据工程师和数据科学家角色。
定义数据范围和治理作为存储管理员或安全管理员,您希望在 AIDE Console 和 ONTAP System Manager 中准备环境:
-
"创建一个或多个工作区"从本地和远程数据源。
-
"配置分类器和护栏策略" 在 AIDE Console 中。
探索工作区元数据作为数据工程师或数据科学家,您希望使用 AIDE Console 探索工作区元数据:
-
"探索工作区元数据" 以了解可用内容。
-
定义应为 RAG 提供数据的一个或多个逻辑子集(例如,支持文章、产品手册或匿名临床备注)。
创建和发布数据收集作为数据工程师或数据科学家,您希望将所选子集转换为 RAG 就绪集合:
-
"创建数据收集"使用选定的过滤器从工作区。
-
"发布数据收集" 并监控索引,直到它达到
Ready状态。 -
复制所选集合的检索端点 URI,并提供给数据科学家或应用程序开发人员。
-
"查看数据收集状态和向量占用空间" 根据需要。