Inicio rápido de Data-to-RAG para AI Data Engine
Pasa de un sistema AI Data Engine (AIDE) recién desplegado a un endpoint de retrieval-augmented generation (RAG) que funcione usando este flujo de trabajo. Entiende cómo colaboran los storage administrators, data engineers y data scientists usando ONTAP System Manager y AIDE Console.
-
Has instalado y añadido nodos de Data compute (DCNs) al clúster de ONTAP.
-
Has instalado y licenciado el software AI Data Engine para vectorización y guardrails.
-
Has configurado "OpenID Connect (OIDC)" y has asignado roles para admin, data engineer y data scientist.
Definir el alcance y la gobernanza de los datosComo administrador de almacenamiento o administrador de seguridad, quieres preparar el entorno en AI Data Engine Console y ONTAP System Manager:
-
"Crea uno o varios espacios de trabajo" de fuentes de datos locales y remotas.
-
"Configura clasificadores y políticas de guardrail" en AI Data Engine Console.
-
"Asigna acceso a los espacios de trabajo a los data engineers y data scientists".
Explora los metadatos del espacio de trabajoComo ingeniero de datos o científico de datos, querrás explorar los metadatos del espacio de trabajo usando AIDE Console:
-
"Explora los metadatos del espacio de trabajo" para entender el contenido disponible.
-
Define uno o varios subconjuntos lógicos de datos que deberían alimentar RAG (por ejemplo, artículos de soporte, manuales de productos o notas clínicas anonimizadas).
Crear y publicar una recopilación de datosComo ingeniero de datos o científico de datos, quieres convertir el subconjunto elegido en una colección lista para RAG:
-
"Crear una colección de datos" del workspace usando los filtros seleccionados.
-
"Publica la recogida de datos" y monitoriza la indexación hasta que alcance el estado
Ready. -
Copia el URI del endpoint de recuperación de la colección elegida y dáselo a los data scientists o a los application developers.
-
"Ver el estado de la recopilación de datos y la huella vectorial" según sea necesario.