Skip to main content
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Saiba mais sobre o NetApp Workload Factory para GenAI

Colaboradores netapp-mwallis

O NetApp Workload Factory para GenAI permite que você integre os sistemas de arquivos Amazon FSx for NetApp ONTAP com os modelos de base do GenAI. Isso fornece armazenamento de alto desempenho com um rico conjunto de recursos de proteção, segurança e otimização de custos para seus conjuntos de dados de IA.

O que é o NetApp Workload Factory para GenAI?

O NetApp Workload Factory para GenAI permite que você use suas fontes de dados empresariais no Amazon FSx for NetApp ONTAP com aplicativos Generative AI. Utilizando a geração aumentada de recuperação (RAG), você pode conectar rapidamente fontes de dados a modelos básicos disponíveis via Amazon Bedrock ou Amazon Q Business para desenvolver aplicativos com tecnologia de IA generativa, como assistentes virtuais, chatbots de perguntas e respostas, sumarização de documentos, criação de conteúdo, etc.

O uso de IA generativa com seus dados organizacionais permite que você aproveite seu próprio conhecimento e experiência, e não confie apenas na inteligência do modelo com base em dados públicos nos quais os modelos foram treinados. O uso do RAG para personalizar os modelos garante respostas precisas e relevantes a perguntas específicas da organização, aumentando a produtividade e a eficiência para os usuários de seus aplicativos usando IA generativa.

Desenvolver um aplicativo GenAI que é adaptado aos dados da sua organização permite que você aproveite seu próprio conhecimento e experiência. Essa capacidade de personalização garante respostas precisas e relevantes a perguntas específicas da organização, aumentando a satisfação e a produtividade de todos os seus usuários.

Se "crie uma base de conhecimento"você , o GenAI ingere dados de suas fontes de dados, armazena os resultados vetorizados em um banco de dados e oferece controle total sobre como usar os dados ingeridos para responder a consultas. Essa abordagem requer uma configuração mais inicial, mas permite que você escolha diferentes modelos de bate-papo para resultados diferentes. Se "definir um conector NetApp para Amazon Q Business"você , os dados de suas fontes de dados serão ingeridos pelo Amazon Q Business e armazenados em um índice. Essa abordagem requer menos configuração inicial, mas oferece menos controle sobre os resultados.

Para obter mais informações sobre o Workload Factory, consulte o "Visão geral da Workload Factory" .

Benefícios de usar o GenAI para criar aplicativos de IA generativos

O NetApp Workload Factory para GenAI simplifica o processo de implantação da infraestrutura necessária para criar aplicativos de IA generativa usando geração aumentada de recuperação (RAG). Especificamente, o GenAI oferece os seguintes benefícios:

  • Sem a necessidade de um conhecimento profundo da infraestrutura de dados, base e modelos de linguagem, os administradores e desenvolvedores DE TI podem acelerar o desenvolvimento de aplicações utilizando a automação fornecida pelo GenAI. Os administradores e desenvolvedores de dados podem criar bases de conhecimento empresariais de forma fácil e rápida que incorporam dados não estruturados da sua organização para serem usados por aplicativos de IA generativos.

  • Melhore a segurança preservando as permissões do usuário em arquivos incorporados nas bases de conhecimento para garantir que a segurança e a privacidade dos dados sejam mantidas. Um aplicativo, como um chatbot, pode ser desenvolvido para fornecer apenas aos usuários autenticados respostas com base nos dados aos quais os usuários têm acesso.

  • Mantenha seus dados empresariais privados e seguros na conta de cliente da AWS, onde seus dados organizacionais nunca serão expostos externamente.

  • Acelere o desenvolvimento de aplicativos GenAI, como um chatbot de Q&A, usando frameworks de código aberto, como o LangChain, utilizando a API GenAI para provisionar e gerenciar bases de conhecimento e conetores, conversar com uma base de conhecimento e armazenar e recuperar histórico de bate-papo.

  • Melhore a proteção e a disponibilidade de dados com a implantação da infraestrutura generativa de dados de AI nos sistemas de arquivos FSX para NetApp ONTAP e aproveite os recursos do ONTAP, como alta disponibilidade, snapshots para proteção e recuperação de dados locais, SnapMirror para recuperação de desastres e SnapVault para fazer backup da sua infraestrutura de dados.

  • Reduza os custos gerais de storage para uma infraestrutura de dados generativa de AI aproveitando os recursos de eficiência de dados da ONTAP, como deduplicação, compressão e compactação de dados, disposição em camadas e thin Provisioning.

  • Obtenha resultados de alta qualidade a partir dos seus dados com os recursos de pesquisa híbrida e classificação fornecidos pelo GenAI. A busca híbrida combinada com a reclassificação melhoram significativamente a relevância dos resultados da pesquisa. Esses recursos estão disponíveis por meio da Amazon AWS e dependem da região.

Como o GenAI funciona

O GenAI usa os dados privados da sua organização para complementar a inteligência do modelo (com base nos dados em que foi treinado) para fornecer respostas personalizadas às perguntas feitas pelos seus usuários em sua organização. Primeiro, você implanta a infraestrutura necessária para uma estrutura RAG, cria uma base de conhecimento ou define um conetor usando fontes de dados e modelos de base da sua organização disponíveis via Amazon bedrock ou Amazon Q Business e coneta um aplicativo (como um chatbot de perguntas e respostas) à base de conhecimento ou ao conetor.

Um diagrama mostrando os principais componentes do GenAI, sua função e como ele funciona.

Como o NetApp Workload Factory para GenAI ajuda a criar aplicativos de IA generativa

O GenAI ajuda a criar aplicativos de IA generativos usando o RAG das seguintes maneiras:

  • Implanta a infraestrutura necessária para a estrutura de geração aumentada de recuperação (RAG) para trabalhar com fontes de dados no FSX para sistemas de arquivos ONTAP e Amazon bedrock ou Amazon Q Business. A infraestrutura inclui a instância do NetApp GenAI Engine para gerenciamento de dados, um banco de dados vetorial incorporado (LanceDB) e armazenamento no sistema de arquivos FSX for ONTAP para o banco de dados vetorial.

  • Ajuda a conetar as fontes de dados a incorporações e modelos de linguagem disponíveis via Amazon bedrock ou Amazon Q Business para incorporar fontes de dados e recuperar as respostas para consultas de usuários. As fontes de dados, juntamente com os modelos e sua configuração, são apresentadas como bases de conhecimento do FSX for ONTAP.

  • Ingere dados de origem na base de conhecimento ou conetor para incorporar arquivos de origem em compartilhamentos SMB e exportações de NFS nos sistemas de arquivos FSX for ONTAP, juntamente com o armazenamento de permissões de arquivos para arquivos em compartilhamentos SMB.

  • Constrói automaticamente perguntas iniciais de conversação com base no conteúdo em bases de conhecimento.

  • Fornece um simulador de bate-papo para os administradores de dados testar conversas com bases de conhecimento.

  • Fornece uma interface de conetor simples para que você possa conetar o GenAI com o Amazon Q Business, de forma rápida e fácil, utilizando os recursos deste assistente de IA.

Ferramentas para usar o NetApp Workload Factory

Você pode usar o NetApp Workload Factory com as seguintes ferramentas:

  • Console do Workload Factory: O console do Workload Factory fornece uma visão visual e holística de seus aplicativos e projetos.

  • * NetApp Console*: O NetApp Console oferece uma experiência de interface híbrida para que você possa usar o Workload Factory junto com outros serviços de dados do NetApp .

  • Pergunte-me: use o assistente de IA Ask me para fazer perguntas e saber mais sobre o Workload Factory sem sair do console do Workload Factory. Acesse Pergunte-me no menu de ajuda do Workload Factory.

  • CloudShell CLI: O Workload Factory inclui um CloudShell CLI para gerenciar e operar ambientes AWS e NetApp em todas as contas a partir de um único CLI baseado em navegador. Acesse o CloudShell na barra superior do console do Workload Factory.

  • API REST: Use as APIs REST do Workload Factory para implantar e gerenciar seu FSx para sistemas de arquivos ONTAP e outros recursos da AWS.

  • CloudFormation: use o código do AWS CloudFormation para executar as ações definidas no console do Workload Factory para modelar, provisionar e gerenciar recursos da AWS e de terceiros da pilha do CloudFormation na sua conta da AWS.

  • Provedor do Terraform NetApp Workload Factory: use o Terraform para criar e gerenciar fluxos de trabalho de infraestrutura gerados no console do Workload Factory.

Custo

Não há custo para usar o recurso GenAI do Workload Factory.

No entanto, você precisará pagar pelos recursos da AWS que implantar para oferecer suporte à infraestrutura de IA generativa. Por exemplo, você pagará a AWS pela Amazon bedrock ou Amazon Q Business, o FSX for ONTAP file system e a capacidade de armazenamento e a instância do GenAI Engine EC2.

Algumas operações multimodais, como a digitalização de imagens para informações de texto, podem usar mais recursos e, portanto, incorrer em um custo mais alto. Algumas operações de configuração, como alterar as configurações de uma base de conhecimento, podem fazer com que as fontes de dados sejam digitalizadas novamente, e as verificações de origem de dados também podem incorrer em um custo mais alto.

Licenciamento

Não são necessárias licenças especiais da NetApp para usar os recursos de IA do Workload Factory.

Regiões

O Workload Factory é suportado em todas as regiões comerciais onde o FSx for ONTAP é suportado."Veja as regiões da Amazon suportadas."

As seguintes regiões da AWS não são suportadas:

  • Regiões da China

  • Regiões GovCloud (EUA)

  • Nuvem Secreta

  • Nuvem Top Secret