AI Data EngineのData-to-RAGクイック スタート
新しく導入されたAI Data Engine(AIDE)システムを、このワークフローを使用して機能する検索拡張生成(RAG)エンドポイントに接続します。ストレージ管理者、データエンジニア、データサイエンティストがONTAP System ManagerとAIDE Consoleを使用してどのように連携しているかを理解します。
-
データコンピューティングノード(DCN)をインストールしてONTAPクラスタに追加しました。
-
AIDE ソフトウェアをベクトル化およびガードレール用にインストールし、ライセンス認証を完了しました。
-
"OpenID Connect(OIDC)"を設定し、管理者、データ エンジニア、データ サイエンティストの役割をマッピングしました。
データの範囲とガバナンスを定義するストレージ管理者またはセキュリティ管理者として、AIDE Console と ONTAP System Manager で環境を準備する必要があります:
-
"1つ以上のワークスペースを作成する"ローカルおよびリモートのデータ ソースから。
-
AIDE コンソールの"分類子とガードレールポリシーを設定する"。
ワークスペースのメタデータを確認するデータエンジニアやデータサイエンティストとして、AIDE Consoleを使用してワークスペースのメタデータを探索する場合:
-
"ワークスペースのメタデータを確認する"利用可能なコンテンツを理解します。
-
RAG に供給するデータの論理サブセットを 1 つ以上定義します(たとえば、サポート記事、製品マニュアル、匿名化された医療データなど)。
データ収集を作成して公開するデータ エンジニアまたはデータ サイエンティストとして、選択したサブセットを RAG 対応のコレクションに変換したいと考えています:
-
選択したフィルターを使用してワークスペースから"データ収集を作成する"。
-
"データ収集を公開する"インデックス作成を監視し、 `Ready`状態になるまで待ちます。
-
選択したコレクションの取得エンドポイント URI をコピーし、データ サイエンティストまたはアプリケーション開発者に提供します。