FAQ para NetApp AI Data Engine
Este FAQ cubre preguntas comunes sobre NetApp AI Data Engine (AIDE), incluyendo su arquitectura, implementación, tipos de usuario, funciones técnicas, integración y licencias.
Conceptos básicos de AIDE
NetApp AI Data Engine (AIDE) es un servicio de datos de IA integrado en el almacenamiento que abarca todo el ciclo de vida de la IA, desde el descubrimiento y la preparación de datos sin procesar hasta el suministro de puntos finales de recuperación para potenciar la IA generativa (GenAI), Retrieval-Augmented Generation (RAG), agentic AI y fábricas de IA. AIDE automatiza la sincronización y la detección de cambios, proporcionando una vista unificada y actualizada de los datos seleccionados para el descubrimiento y la curación de datos.
AIDE se integra directamente con los sistemas de almacenamiento NetApp ONTAP para crear una vista global y estructurada de toda la propiedad de datos de NetApp con detección de cambios y sincronización automatizadas. AIDE proporciona vectorización en tiempo real con compresión y deduplicación, Data Guardrails condicionados por políticas e integración con herramientas de IA.
Usuarios y roles
Los usuarios principales de AIDE incluyen:
-
Administradores de almacenamiento ONTAP: gestionan la infraestructura, las necesidades de almacenamiento específicas de la IA, la seguridad y el cumplimiento.
-
Ingenieros de datos: gestionan el movimiento, la preparación y la integración de datos en distintos entornos.
-
Científicos de datos: Prepara y transforma los datos relevantes para el consumo de IA.
Requisitos y despliegue
AIDE requiere sistemas AFX para el despliegue (incluyendo un controlador AFX, una bandeja de discos y un switch de red), pero puede usar datos de clústeres que ejecutan ONTAP 9 usando SnapMirror y cluster peering. Se requieren al menos cuatro nodos de controlador AFX para los despliegues de AIDE para asegurar alta disponibilidad y rendimiento.
AIDE se ejecuta en un nodo de computación de datos NetApp (DCN). Se requieren tres DCN. El DCN aloja el software AIDE, que incluye el Metadata Engine, Data Sync, Data Curator y Data Guardrails.
No. La DCN es un nodo de hardware de cálculo de datos proporcionado por NetApp y es el único mecanismo de despliegue para el AI Data Engine.
Se necesitan exactamente tres DCN.
Las DCN ejecutan una pila de software proporcionada por NetApp con AIDE.
No. AIDE requiere AFX para el despliegue. AIDE usa Trident para consumir los volúmenes de AFX para almacenamiento interno (volúmenes persistentes). El clúster AFX que proporciona almacenamiento para AIDE puede estar emparejado con un sistema o clúster ONTAP 9. Usa cluster peering y SnapMirror para sincronizar datos desde el clúster ONTAP remoto al sistema AFX.
Gestión e interfaces
La AIDE Console es una interfaz de gestión independiente que se ejecuta en los DCN. Usas la AIDE Console para gestionar servicios de AIDE, como Data Guardrails y Data Curator. También puedes usar ONTAP System Manager para monitorear el clúster de AIDE.
Funciones y capacidades
Hay cuatro funciones clave de AIDE:
-
Genera automáticamente una vista estructurada, actualizada e interactiva de tus datos.
-
Trabaja con datos almacenados en ONTAP.
-
Permite a los profesionales de datos colaborar con los administradores de almacenamiento para encontrar y entender los datos.
-
Las API consultan los metadatos para proporcionar capacidades mientras reducen la carga de tráfico NFS en los sistemas de almacenamiento.
-
La capacidad de extracción y catalogación de metadatos está diseñada específicamente para AIDE, funciona de manera continua y aprovecha las capacidades de ONTAP como los snapshots.
-
Mantiene la actualidad de los datos automáticamente a medida que cambian los datos de origen sin intervención manual.
-
Los administradores definen el intervalo de actualización de los datos en días o horas.
-
Proporciona movilidad de datos incremental y sincronización entre los datos para eliminar copias redundantes de los datos de IA.
-
Identifica y protege automáticamente los datos confidenciales durante todo el ciclo de vida de la IA. Está disponible a través de AI Data Engine Console.
-
Escanea, clasifica y categoriza datos de forma continua.
-
Identifica datos sensibles (como PII) y riesgos.
-
Facilita la creación de políticas para el manejo automático de datos sensibles en línea con los estándares de la empresa y las normativas regulatorias.
-
Proporciona redacción automática de información sensible para la protección de datos.
-
Restringe el acceso a los archivos confidenciales según sea necesario.
-
Permite a los científicos de datos buscar en todo el almacenamiento datos relevantes.
-
Crea colecciones de datos curados con datos existentes en volúmenes AFX.
-
Genera incrustaciones vectoriales en la capa de almacenamiento para reducir la sobrecarga de datos y aumentar el rendimiento.
-
Proporciona un punto final de recuperación para aplicaciones de IA con búsqueda semántica vectorial y re-ranking.
Integración e interoperabilidad
AIDE puede conectarse a múltiples clústeres ONTAP usando SnapMirror y cluster peering, permitiendo la visibilidad centralizada de metadatos.
AIDE almacena metadatos en el AFX cluster conectado usando un volumen persistente proporcionado por AFX. Las DCNs usan almacenamiento local para operaciones internas.
No. El Metadata Engine cataloga los metadatos del sistema de archivos y proporciona API para consultar estos metadatos catalogados.
AIDE soporta volúmenes ONTAP (locales o remotos) como fuentes de datos. Los clústeres ONTAP remotos deben ejecutar ONTAP 9 y estar conectados mediante cluster peering y SnapMirror.
Los buckets S3 de ONTAP y los objetos StorageGRID no son compatibles como fuentes de datos en AIDE 9.18.1.
AIDE admite una amplia gama de tipos de archivo, incluyendo PDF, DOCX, PPTX, TXT y archivos de imagen con capacidades de OCR.
AIDE solo admite datos en inglés.
AIDE proporciona un endpoint de API RAG accesible a través de llamadas directas a la API o a través de un servidor Model Context Protocol (MCP). Esto admite la integración con frameworks y herramientas de IA agentic.
Implementación y licencias
AIDE se despliega on-premises en la infraestructura AFX con DCNs. Se integra directamente con NetApp ONTAP AFX installations.
AIDE requiere una licencia de software para ejecutar Data Guardrails y Data Curator.
Si solo necesitas el Metadata Engine, la licencia ONTAP One, que viene incluida con todos los sistemas AFX, te da derecho a las capacidades solo de Metadata Engine.