Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Obtén más información sobre el centro de cargas de trabajo de BlueXP  para GenAI

Colaboradores netapp-mwallis

La fábrica de cargas de trabajo de BlueXP  para GenAI le permite integrar sistemas de archivos de Amazon FSx para NetApp ONTAP con los modelos de base GenAI. Esto ofrece un almacenamiento de alto rendimiento con un amplio conjunto de funciones de protección, seguridad y optimización de costes para sus conjuntos de datos de IA.

¿Qué es la fábrica de cargas de trabajo de BlueXP  para GenAI?

La fábrica de cargas de trabajo de BlueXP  para GenAI te permite utilizar tus fuentes de datos empresariales en Amazon FSx para NetApp ONTAP con aplicaciones de IA generativas. Mediante la generación aumentada de recuperación (RAG), puedes conectar rápidamente fuentes de datos con modelos de base disponibles a través de Amazon Bedrock o Amazon Q Business para desarrollar aplicaciones impulsadas por IA generativa, como asistentes virtuales, bots conversacionales de preguntas y respuestas, resumen de documentos, creación de contenido, etc.

El uso de la IA generativa con los datos de su organización le permite aprovechar sus propios conocimientos y experiencia, en lugar de depender únicamente de la inteligencia del modelo basada en datos públicos en los que se entrenaron los modelos. El uso de RAG para personalizar los modelos garantiza respuestas precisas y relevantes a preguntas específicas de la organización, mejorando la productividad y la eficiencia para los usuarios de sus aplicaciones mediante IA generativa.

El desarrollo de una aplicación de GenAI adaptada a los datos de su organización le permite aprovechar su propio conocimiento y experiencia. Esta capacidad de personalización garantiza respuestas precisas y relevantes a preguntas específicas de la organización, mejorando la satisfacción y la productividad de todos sus usuarios.

Si "crear una base de conocimientos"GenAI ingiere datos de sus orígenes de datos, almacena los resultados vectorizados en una base de datos y le proporciona un control total sobre cómo utilizar los datos ingeridos para responder a las consultas. Este enfoque requiere más configuración inicial, pero le permite elegir diferentes modelos de chat para diferentes resultados. Si usted "definir un conector NetApp para Amazon Q Business", los datos de sus orígenes de datos los consume Amazon Q Business y los almacena en un índice. Este enfoque requiere menos configuración inicial, pero le da menos control sobre los resultados.

Para obtener más información sobre la fábrica de cargas de trabajo, consulte la "información general de la fábrica de cargas de trabajo".

Beneficios de usar GenAI para crear aplicaciones de IA generativas

La fábrica de cargas de trabajo de BlueXP  para GenAI simplifica el proceso de implementación de la infraestructura necesaria para construir aplicaciones de IA generativas mediante la generación aumentada de recuperación (RAG). Específicamente, GenAI ofrece los siguientes beneficios:

  • Sin necesidad de un profundo conocimiento de la infraestructura de datos, los modelos de lenguaje y bases, los administradores y desarrolladores DE TI pueden acelerar el desarrollo de aplicaciones utilizando la automatización que ofrece GenAI. Los administradores y los desarrolladores de datos pueden crear de forma rápida y sencilla bases de conocimientos empresariales que integren los datos no estructurados de su organización para que los usen las aplicaciones de IA generativas.

  • Mejore la seguridad al conservar los permisos de los usuarios en los archivos integrados en las bases de conocimiento para garantizar que se mantenga la seguridad y la privacidad de los datos. Una aplicación, como un chatbot, se puede desarrollar para proporcionar solo a los usuarios autenticados respuestas basadas en los datos a los que los usuarios tienen acceso.

  • Mantenga la privacidad y seguridad de los datos de su empresa desde su cuenta de cliente de AWS, donde los datos de su organización nunca se exponen externamente.

  • Acelere el desarrollo de aplicaciones de GenAI, como un chatbot de preguntas y respuestas mediante marcos de código abierto como LangChain, utilizando la API de GenAI para aprovisionar y gestionar bases de conocimiento y conectores, chatear con una base de conocimientos y almacenar y recuperar el historial de chat.

  • Mejora la protección de datos y la política de disponibilidad mediante la puesta en marcha de la infraestructura de datos de IA generativa en sistemas de archivos FSx para NetApp ONTAP y el aprovechamiento de funciones de ONTAP, como la alta disponibilidad, los snapshots para la protección y recuperación de datos locales, SnapMirror para la recuperación ante desastres y SnapVault para hacer backups de tu infraestructura de datos.

  • Reduce los costes generales de almacenamiento para la infraestructura de datos de IA generativa aprovechando funciones de eficiencia de datos de ONTAP como deduplicación de datos, compresión y compactación, organización en niveles de los datos y thin provisioning.

  • Obtenga resultados de alta calidad de sus datos con las funciones de búsqueda híbrida y reclasificación proporcionadas por GenAI. La búsqueda híbrida combinada con la re-clasificación mejora en gran medida la relevancia de los resultados de búsqueda. Estas funciones están disponibles a través de Amazon AWS y dependen de la región.

Cómo funciona GenAI

GenAI utiliza los datos privados de su organización para complementar la inteligencia del modelo (basada en los datos en los que se entrenó) con el fin de proporcionar respuestas personalizadas a las preguntas formuladas por los usuarios de su organización. En primer lugar, debe implementar la infraestructura necesaria para un marco RAG, luego crear una base de conocimientos o definir un conector utilizando las fuentes de datos y los modelos de base de su organización disponibles a través de Amazon Bedrock o Amazon Q Business y, a continuación, conectar una aplicación (como un chatbot de preguntas y respuestas) a la base de conocimientos o el conector.

Un diagrama que muestra los componentes clave de GenAI, su función y cómo funciona.

Cómo la fábrica de cargas de trabajo de BlueXP  para GenAI ayuda a crear aplicaciones de IA generativas

GenAI ayuda a construir aplicaciones de IA generativas usando RAG de las siguientes maneras:

  • Pone en marcha la infraestructura necesaria para el marco de generación aumentada de recuperación (RAG) con el fin de trabajar con fuentes de datos en los sistemas de archivos FSx para ONTAP y Amazon Bedrock o Amazon Q Business. La infraestructura incluye la instancia del motor GenAI de NetApp para gestionar los datos, una base de datos vectorial incorporada (LanceDB) y almacenamiento en el sistema de archivos FSx para ONTAP para la base de datos vectorial.

  • Ayuda a conectar las fuentes de datos con incrustaciones y modelos de lenguaje disponibles a través de Amazon Bedrock o Amazon Q Business para incrustar fuentes de datos y recuperar las respuestas de las consultas de los usuarios. Las fuentes de datos, junto con los modelos y su configuración, se presentan como bases de conocimiento de FSx para ONTAP.

  • Procesa datos de origen en el conector o la base de conocimientos para incrustar archivos de origen en recursos compartidos SMB y exportaciones NFS en sistemas de archivos FSx para ONTAP, junto con almacenar permisos de archivos para archivos dentro de recursos compartidos SMB.

  • Crea automáticamente preguntas para iniciar conversaciones basadas en el contenido de las bases de conocimientos.

  • Proporciona un simulador de chat para que los administradores de datos prueben el chat con bases de conocimientos.

  • Proporciona una interfaz de conector simple para que pueda conectar GenAI con Amazon Q Business, de forma rápida y sencilla utilizando las capacidades de este asistente de IA.

Herramientas para utilizar la fábrica de cargas de trabajo

Puede utilizar la fábrica de cargas de trabajo de BlueXP  con las siguientes herramientas:

  • Consola de fábrica de carga de trabajo: La consola de fábrica de carga de trabajo proporciona una visión visual y holística de sus aplicaciones y proyectos.

  • Consola BlueXP : La consola BlueXP  proporciona una experiencia de interfaz híbrida para que pueda usar la fábrica de cargas de trabajo BlueXP  junto con otros servicios BlueXP .

  • Pregúntame: Usa el asistente de Ask Me AI para hacer preguntas y aprender más sobre la fábrica de cargas de trabajo sin salir de la interfaz de usuario web de la fábrica de cargas de trabajo. Acceda a Preguntarme desde el menú de ayuda de fábrica de cargas de trabajo.

  • CLI de CloudShell: La fábrica de cargas de trabajo incluye una CLI de CloudShell para administrar y operar entornos de AWS y NetApp a través de cuentas desde una única CLI basada en navegador. Acceda a CloudShell desde la barra superior de la consola de fábrica de cargas de trabajo.

  • API REST: Usa las API REST DE fábrica de cargas de trabajo para implementar y administrar tus sistemas de archivos FSx para ONTAP y otros recursos de AWS.

  • CloudFormation: Utilice el código CloudFormation de AWS para realizar las acciones que definió en la consola de la fábrica de cargas de trabajo para modelar, aprovisionar y administrar recursos de AWS y de terceros desde la pila CloudFormation en su cuenta de AWS.

  • * Proveedor de fábrica de cargas de trabajo Terraform BlueXP *: Utilice Terraform para crear y administrar flujos de trabajo de infraestructura generados en la consola de la fábrica de cargas de trabajo.

Coste

No hay coste para utilizar la capacidad GenAI de la fábrica de cargas de trabajo.

Sin embargo, tendrá que pagar por los recursos de AWS que ponga en marcha para dar soporte a la infraestructura de IA generativa. Por ejemplo, pagará a AWS por Amazon Bedrock o Amazon Q Business, FSX para el sistema de archivos y la capacidad de almacenamiento de ONTAP y la instancia EC2 del motor GenAI.

Algunas operaciones multimodales, como escanear imágenes para obtener información de texto, pueden utilizar más recursos y, por lo tanto, incurrir en un costo mayor. Algunas operaciones de configuración, como cambiar los ajustes de una base de conocimiento, pueden hacer que los orígenes de datos se vuelvan a analizar y los análisis de orígenes de datos también pueden suponer un coste mayor.

Licencia

NetApp no necesita licencias especiales para utilizar las capacidades de IA de la fábrica de cargas de trabajo.