Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Inicio rápido de Data-to-RAG para AI Data Engine

04/30/2026 Colaboradores

PDF

Pasa de un sistema AI Data Engine (AIDE) recién desplegado a un endpoint de retrieval-augmented generation (RAG) que funcione usando este flujo de trabajo. Entiende cómo colaboran los storage administrators, data engineers y data scientists usando ONTAP System Manager y AIDE Console.

Las siguientes instrucciones suponen un despliegue de AIDE basado en NetApp DCN.

Antes de empezar

Has instalado y añadido NetApp DCNs al clúster ONTAP.
Has instalado AIDE y activado la licencia de servicios premium de AIDE para las funciones de vectorización y guardrails.
Has configurado "OpenID Connect (OIDC)" y has asignado roles para admin, data engineer y data scientist.

Definir el alcance y la gobernanza de los datos

Como administrador de almacenamiento o administrador de seguridad, quieres preparar el entorno en AI Data Engine Console y ONTAP System Manager:

"Crea uno o varios espacios de trabajo" de fuentes de datos locales y remotas.
"Configura clasificadores y políticas de guardrail" en AI Data Engine Console.
"Asigna acceso a los espacios de trabajo a los data engineers y data scientists".

Explora los metadatos del espacio de trabajo

Como ingeniero de datos o científico de datos, querrás explorar los metadatos del espacio de trabajo usando AIDE Console:

"Explora los metadatos del espacio de trabajo" para entender el contenido disponible.
Define uno o varios subconjuntos lógicos de datos que deberían alimentar RAG (por ejemplo, artículos de soporte, manuales de productos o notas clínicas anonimizadas).

Crear y publicar una recopilación de datos

Como ingeniero de datos o científico de datos, quieres convertir el subconjunto elegido en una colección lista para RAG:

"Crear una colección de datos" del workspace usando los filtros seleccionados.
"Publica la recogida de datos" y monitoriza la indexación hasta que alcance el estado Ready.
Copia el URI del endpoint de recuperación de la colección elegida y dáselo a los data scientists o a los application developers.
"Ver el estado de la recopilación de datos y la huella vectorial" según sea necesario.

¿Qué sigue?

Inicio rápido de Data-to-RAG para AI Data Engine

Creating your file...