Skip to main content
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Implantar a infraestrutura do GenAI

Colaboradores netapp-mwallis

Você precisa implantar a infraestrutura do GenAI para a estrutura RAG em seu ambiente antes de criar bases de conhecimento, conetores e aplicativos do FSX for ONTAP para sua organização. Os principais componentes da infraestrutura são o serviço Amazon bedrock, uma instância de máquina virtual para o mecanismo NetApp GenAI e um sistema de arquivos FSX for ONTAP.

A infraestrutura implantada pode oferecer suporte a várias bases de conhecimento, chatbots e conetores, portanto, você normalmente só precisará executar essa tarefa uma vez.

Detalhes da infraestrutura

Sua implantação do GenAI deve estar em uma região da AWS que tenha o Amazon bedrock habilitado. "Veja a lista de regiões suportadas"

A infraestrutura consiste nos seguintes componentes.

Serviço Amazon bedrock

O Amazon bedrock é um serviço totalmente gerenciado que permite que você use os modelos de base (FMS) das principais empresas de IA por meio de uma única API. Ele também fornece os recursos de que você precisa para criar aplicativos de IA generativos seguros.

Amazon Q Business

O Amazon Q baseia-se no Amazon bedrock para fornecer um assistente de IA generativa totalmente gerenciado que você pode usar para responder perguntas e gerar conteúdo com base em informações de suas fontes de dados.

Máquina virtual para o motor NetApp GenAI

O mecanismo NetApp GenAI é implantado durante esse processo. Ele fornece o poder de processamento para obter os dados de suas fontes de dados e, em seguida, gravar esses dados no banco de dados vetorial.

FSX para sistema de arquivos ONTAP

O sistema de arquivos FSX for ONTAP fornece o armazenamento para o seu sistema GenAI.

Um único volume é implantado que conterá o banco de dados vetorial que armazena os dados gerados pelo modelo básico com base em suas fontes de dados.

As fontes de dados que você integrará em sua base de conhecimento podem residir no mesmo sistema de arquivos FSX for ONTAP ou em um sistema diferente.

O mecanismo NetApp GenAI monitora e interage com ambos esses volumes.

A imagem a seguir mostra a infraestrutura do GenAI. Os componentes numerados 1, 2 e 3 são acionados durante este procedimento. Os outros elementos devem estar no lugar antes de iniciar a implantação.

Um diagrama dos componentes da infraestrutura do GenAI.

Implantar a infraestrutura do GenAI

Você precisará inserir suas credenciais da AWS e selecionar o sistema de arquivos FSX for ONTAP para implantar a infraestrutura de geração de recuperação aumentada (RAG).

Antes de começar

Certifique-se de que seu ambiente atenda aos requisitos de bases de conhecimento ou conetores, dependendo do que você escolher, antes de iniciar este procedimento.

Passos
  1. Faça login no Workload Factory usando um dos"experiências de console" .

  2. No bloco cargas de trabalho de IA, selecione Deploy & Manage.

  3. Revise o diagrama de infraestrutura e selecione Next.

  4. Preencha os itens na seção AWS settings:

    1. Credenciais da AWS: Selecione ou adicione as credenciais da AWS que fornecem permissões para implantar os recursos da AWS.

    2. Localização: Selecione uma região, VPC e sub-rede da AWS.

      A implantação do GenAI deve estar em uma região da AWS que tenha o Amazon bedrock habilitado. "Veja a lista de regiões suportadas"

  5. Preencha os itens na seção Configurações de infra-estrutura:

    1. Tags: insira quaisquer pares de chave/valor de tag que você deseja aplicar a todos os recursos da AWS que fazem parte desta implantação. Essas tags são visíveis no AWS Management Console e na área de informações de infraestrutura do Workload Factory e podem ajudar você a controlar os recursos do Workload Factory.

  6. Preencha a seção conetividade:

    1. Par de chaves: Selecione um par de chaves que permita que você se conete com segurança à instância do mecanismo NetApp GenAI.

  7. Complete a seção AI Engine:

    1. Nome da instância: Opcionalmente, selecione Definir nome da instância e insira um nome personalizado para a instância do mecanismo de IA. O nome da instância aparece no AWS Management Console e na área de informações de infraestrutura do Workload Factory e pode ajudar você a controlar os recursos do Workload Factory.

  8. Selecione Deploy para iniciar a implantação.

    Observação Se a implantação falhar com um erro de credenciais, você poderá obter mais detalhes de erro selecionando os hiperlinks dentro da mensagem de erro. Você pode ver uma lista de permissões ausentes ou bloqueadas, bem como uma lista de permissões que a carga de trabalho do GenAI precisa para que ela possa implantar a infraestrutura do GenAI.
Resultado

A Workload Factory começa a implantar a infraestrutura do chatbot. Esse processo pode levar até 10 minutos.

Durante o processo de implantação, os seguintes itens são configurados:

  • A rede é configurada juntamente com os endpoints privados.

  • A função do IAM, o perfil da instância e o grupo de segurança são criados.

  • A instância de máquina virtual para o mecanismo GenAI é implantada.

  • O Amazon bedrock está configurado para enviar logs para o Amazon CloudWatch Logs, usando um grupo de log com o prefixo /aws/bedrock/.

  • O mecanismo GenAI está configurado para enviar logs para o Amazon CloudWatch Logs, usando um grupo de logs com o nome /netapp/wlmai/<tenancyAccountId>/randomId , onde <tenancyAccountID> é o "ID da conta do console NetApp" para o usuário atual.