Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

FAQ para NetApp AI Data Engine

Colaboradores netapp-dbagwell

Este FAQ cubre preguntas comunes sobre NetApp AI Data Engine (AIDE), incluyendo su arquitectura, implementación, tipos de usuario, funciones técnicas, integración y licencias.

Conceptos básicos de AIDE

¿Qué es NetApp AI Data Engine?

NetApp AI Data Engine (AIDE) es un servicio de datos de IA integrado en el almacenamiento que abarca todo el ciclo de vida de la IA, desde el descubrimiento y la preparación de datos sin procesar hasta el suministro de puntos finales de recuperación para potenciar la IA generativa (GenAI), Retrieval-Augmented Generation (RAG), agentic AI y fábricas de IA. AIDE automatiza la sincronización y la detección de cambios, proporcionando una vista unificada y actualizada de los datos seleccionados para el descubrimiento y la curación de datos.

¿Cómo funciona AIDE?

AIDE se integra directamente con los sistemas de almacenamiento NetApp ONTAP para crear una vista global y estructurada de toda la propiedad de datos de NetApp con detección de cambios y sincronización automatizadas. AIDE proporciona vectorización en tiempo real con compresión y deduplicación, Data Guardrails condicionados por políticas e integración con herramientas de IA.

Usuarios y roles

¿Quién usa AI Data Engine?

Los usuarios principales de AIDE incluyen:

  1. Administradores de almacenamiento ONTAP: gestionan la infraestructura, las necesidades de almacenamiento específicas de la IA, la seguridad y el cumplimiento.

  2. Ingenieros de datos: gestionan el movimiento, la preparación y la integración de datos en distintos entornos.

  3. Científicos de datos: Prepara y transforma los datos relevantes para el consumo de IA.

Requisitos y despliegue

¿Qué opciones de despliegue existen para AIDE?

AIDE ofrece dos opciones de despliegue:

  • Despliegue de nodos de cómputo de datos NetApp (DCN): AIDE se ejecuta en nodos de cómputo de datos proporcionados por NetApp con recursos de GPU integrados, ofreciendo todas las capacidades de AIDE, incluyendo metadatos, vectorización y endpoints RAG.

  • Software AIDE en servidores de terceros: El software AIDE se ejecuta en servidores RHEL 9.7 proporcionados por el cliente utilizando hardware de terceros compatible. Una implantación básica de Metadata Engine proporciona funciones de catalogación y descubrimiento de metadatos, pero no incluye funciones dependientes de GPU.

¿Qué hardware se necesita para las implementaciones de NetApp DCN?

NetApp Las implementaciones de DCN requieren sistemas AFX (incluyendo un controlador AFX, un shelf de discos y un switch de red) y tres nodos de cómputo de datos NetApp. Se requieren al menos cuatro nodos de controlador AFX para asegurar alta disponibilidad y rendimiento.

¿Qué hardware se necesita para implantar el software AIDE con la funcionalidad básica de Metadata Engine en servidores de terceros?

El software AIDE con funcionalidades básicas de Metadata Engine desplegado en servidores de terceros requiere:

  • Tres servidores de proveedores compatibles adquiridos por el cliente

  • RHEL 9.7 LTS instalado en todos los servidores

  • Sistema de almacenamiento AFX con ONTAP 9.18.1 o posterior para almacenamiento persistente

¿Puedo utilizar mis propios servidores para AIDE completo con funciones de GPU?

La versión 1.0.0 de AIDE es compatible con el motor de metadatos básico en servidores de terceros en hardware proporcionado por el cliente. Las capacidades completas de AIDE con funciones de GPU requieren hardware NetApp DCN.

¿Cuál es el número mínimo de NetApp DCN necesario?

Se necesitan exactamente tres NetApp DCN.

¿Qué sistema operativo se ejecuta en los nodos AIDE?

El sistema operativo depende de tu tipo de despliegue:

  • NetApp DCN: pila de software proporcionada y gestionada por NetApp

  • Software AIDE con funcionalidad básica de Metadata Engine en servidores de terceros: Red Hat Enterprise Linux (RHEL) 9.7 LTS, instalado y gestionado por el cliente

¿Se puede desplegar AIDE sin AFX?

No. AIDE requiere AFX para su despliegue. AIDE utiliza "Trident" para consumir los volúmenes AFX para almacenamiento interno (volúmenes persistentes). El cluster AFX que proporciona almacenamiento para AIDE puede ser peered con un sistema o cluster ONTAP 9. Utiliza cluster peering y SnapMirror para sincronizar los datos del cluster ONTAP remoto con el sistema AFX.

Gestión e interfaces

¿AIDE Console es parte de NetApp Console o una interfaz separada?

AIDE Console es una interfaz de gestión independiente que se ejecuta en las DCN de NetApp. Usas AIDE Console para gestionar los servicios de AIDE, como Data Guardrails y Data Curator. También puedes usar ONTAP System Manager para supervisar el clúster de AIDE.

Funciones y capacidades

¿Cuáles son las funciones clave de AIDE?

AIDE ofrece cuatro funciones principales, cuya disponibilidad depende de tu tipo de implementación:

Metadata Engine (disponible en todas las implantaciones)
  • Genera automáticamente una vista estructurada, actualizada e interactiva de tus datos.

  • Trabaja con datos almacenados en ONTAP.

  • Permite a los profesionales de datos colaborar con los administradores de almacenamiento para encontrar y entender los datos.

  • Las API consultan los metadatos para proporcionar capacidades mientras reducen la carga de tráfico NFS en los sistemas de almacenamiento.

  • La capacidad de extracción y catalogación de metadatos está diseñada específicamente para AIDE, funciona de manera continua y aprovecha las capacidades de ONTAP como los snapshots.

Sincronización de datos (disponible en todas las implementaciones)
  • Mantiene la actualidad de los datos automáticamente a medida que cambian los datos de origen sin intervención manual.

  • Los administradores definen el intervalo de actualización de los datos en días o horas.

  • Proporciona movilidad de datos incremental y sincronización entre los datos para eliminar copias redundantes de los datos de IA.

Data Guardrails (NetApp DCN solo con la licencia requerida)
  • Identifica y protege automáticamente los datos confidenciales durante todo el ciclo de vida de la IA. Es accesible a través de AIDE Console.

  • Escanea, clasifica y categoriza datos de forma continua.

  • Identifica datos sensibles (como PII) y riesgos.

  • Facilita la creación de políticas para el manejo automático de datos sensibles en línea con los estándares de la empresa y las normativas regulatorias.

  • La aplicación completa de las políticas (redacción automática y restricción de acceso) requiere capacidades de vectorización disponibles únicamente en las implementaciones de NetApp DCN.

  • El software AIDE con la funcionalidad básica de Metadata Engine en servidores de terceros admite el etiquetado de metadatos basado en clasificadores, pero no la aplicación de Data Guardrails.

Data Curator (NetApp DCN solo con la licencia requerida)
  • Permite a los científicos de datos buscar en todo el almacenamiento datos relevantes.

  • Crea colecciones de datos curados con datos existentes en volúmenes AFX.

  • Genera incrustaciones vectoriales en la capa de almacenamiento para reducir la sobrecarga de datos y aumentar el rendimiento.

  • Proporciona un punto final de recuperación para aplicaciones de IA con búsqueda semántica vectorial y re-ranking.

Nota El software AIDE con la funcionalidad básica de Metadata Engine en servidores de terceros incluye las capacidades de Metadata Engine y Data Sync. Data Guardrails y Data Curator requieren recursos de GPU disponibles en los despliegues de NetApp DCN.
¿Qué funciones ofrece el software AIDE en servidores de terceros en comparación con NetApp DCN?

El software AIDE en servidores de terceros ofrece funciones centradas en los metadatos:

Disponible con el software AIDE con funcionalidad básica de Metadata Engine en servidores de terceros:

  • Creación y gestión de espacios de trabajo

  • Extracción y catalogación automatizadas de metadatos

  • Búsqueda y filtrado de metadatos mediante REST APIs

  • Sincronización de datos para la actualización automática de datos

  • Funcionalidad de exportación de metadatos

No disponible con el software AIDE con funcionalidad básica de Metadata Engine en servidores de terceros:

  • Servicios dependientes de la GPU (vectorización, OCR, enriquecimiento)

  • Colecciones de datos e incrustaciones vectoriales

  • Puntos finales RAG para la búsqueda semántica

  • Aplicación de la política de Data Guardrails en el momento de la recuperación

Integración e interoperabilidad

¿AIDE admite metadatos federados en varios clústeres ONTAP?

AIDE puede conectarse a múltiples clústeres ONTAP usando SnapMirror y cluster peering, permitiendo la visibilidad centralizada de metadatos.

¿Dónde se almacenan los metadatos?

AIDE almacena metadatos en el clúster AFX conectado utilizando un volumen persistente proporcionado por AFX. Los nodos de computación de datos utilizan almacenamiento local para operaciones internas.

¿El Metadata Engine de AIDE clasifica los datos?

No. AIDE Metadata Engine cataloga los metadatos del sistema de archivos y proporciona APIs para consultar estos metadatos catalogados.

¿Qué fuentes de datos son compatibles?

AIDE soporta volúmenes ONTAP (locales o remotos) como fuentes de datos. Los clústeres ONTAP remotos deben ejecutar ONTAP 9 y estar conectados mediante cluster peering y SnapMirror.

Los buckets S3 de ONTAP y los objetos StorageGRID no son compatibles como fuentes de datos en AIDE 9.18.1.

¿Qué tipos de archivos puede procesar AIDE para clasificación, vectorización y búsqueda semántica?

AIDE admite una amplia gama de tipos de archivo, incluyendo PDF, DOCX, PPTX, TXT y archivos de imagen con capacidades de OCR.

¿AIDE admite la clasificación de datos que no están en inglés?

AIDE solo admite datos en inglés.

¿Qué integraciones admite AIDE?

AIDE proporciona un endpoint de API RAG accesible a través de llamadas directas a la API o a través de un servidor Model Context Protocol (MCP). Esto admite la integración con frameworks y herramientas de IA agentic.

Licencias

¿Cómo se licencia AIDE?

La licencia de AIDE depende del tipo de despliegue y de las características requeridas:

Implementaciones de NetApp DCN:

  • Data Guardrails y Data Curator requieren la licencia de servicios premium de AIDE

  • Las funciones de Metadata Engine y Data Sync se incluyen con la licencia ONTAP One (incluida en todos los sistemas AFX)

Software AIDE con funcionalidad básica de Metadata Engine en servidores de terceros:

  • La licencia ONTAP One da derecho a las funciones de Metadata Engine y Data Sync

  • Data Guardrails y Data Curator no están disponibles para las implementaciones de la funcionalidad básica de Metadata Engine en servidores de terceros