Skip to main content
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Requisitos da base de conhecimento GenAI

Colaboradores netapp-mwallis

Certifique-se de que o Workload Factory e o AWS estejam configurados corretamente antes de criar sua base de conhecimento. Isso inclui ter suas credenciais de login da AWS, um sistema de arquivos FSx for ONTAP implantado que contém as fontes de dados que você deseja integrar à sua base de conhecimento, acesso ao serviço Amazon Bedrock AI e muito mais.

Requisitos básicos do GenAI

A GenAI tem requisitos gerais que seu ambiente precisa atender antes de começar.

Login e conta do Workload Factory

Você precisará "crie uma conta no Workload Factory" e faça login usando um dos "experiências de console" .

Credenciais e permissões da AWS

Você precisa adicionar credenciais da AWS ao Workload Factory com permissões de leitura/gravação, o que significa que você usará o Workload Factory no modo leitura/gravação para o GenAI.

As permissões do modo Basic e do modo Read-Only não são suportadas neste momento.

Ao configurar suas credenciais, selecionar permissões como mostrado abaixo fornece acesso total para gerenciar os sistemas de arquivos FSX for ONTAP e implantar e gerenciar a instância do GenAI EC2 e outros recursos da AWS necessários para sua base de conhecimento e chatbot.

Requisitos da base de conhecimento GenAI

Se você planeja trabalhar com bases de conhecimento, certifique-se de que seu ambiente atenda aos seguintes requisitos.

Amazon bedrock

O Amazon bedrock permite que você use modelos de base e fornece os recursos para criar aplicativos de IA generativos.

Antes de começar a usar o NetApp Workload Factory para GenAI, você precisa configurar o Amazon Bedrock. Sua implantação do GenAI deve estar em uma região da AWS que tenha o Amazon Bedrock habilitado.

O GenAI reclassifica os resultados da pesquisa por padrão para melhorar a relevância do resultado. Para obter os melhores resultados, certifique-se de que a configuração do modelo de base do Amazon bedrock inclua acesso a um modelo de reclassificação, como cohere Rerank ou Amazon Rerank, se disponível em sua região.

Modelo de incorporação

Você deve habilitar o modelo de incorporação que você planeja usar antes de criar sua base de conhecimento. Os seguintes modelos de incorporação são suportados:

  • Titãs incorporações G1 - texto

  • Texto de incorporação Titan v2

  • Incorporações multimodais Titan G1

  • Incorpore o inglês

  • Incorpore multilíngue

Modelo de chat

Você deve habilitar o modelo básico de bate-papo que planeja usar antes de criar sua base de conhecimento. Como o suporte ao modelo varia de acordo com a região da AWS, "A documentação da AWS" consulte para verificar quais modelos você pode usar nas regiões em que planeja implantar sua base de conhecimento.

O GenAI suporta vários modelos de Antropometria, Amazon, Mistral AI, Meta, Jamba e cohere.

Saiba mais sobre como usar esses modelos no Amazon bedrock:

FSX para sistema de arquivos ONTAP

Você precisa de um mínimo de um sistema de arquivos FSX for ONTAP:

  • Um sistema de arquivos será usado (ou criado, se não existir) pelo mecanismo NetApp GenAI para armazenar o banco de dados de vetor usado pela base de dados de conhecimento.

    Este sistema de arquivos FSX for ONTAP deve usar o FlexVol volumes. Os volumes FlexGroup não são compatíveis.

  • Um ou mais sistemas de arquivos conterá as fontes de dados que você estará integrando em sua base de conhecimento.

    Um sistema de arquivos FSX for ONTAP pode ser usado para ambos esses fins, ou você pode usar vários sistemas de arquivos FSX for ONTAP.

  • Você precisará conhecer a região, a VPC e a sub-rede da AWS onde reside o sistema de arquivos do AWS FSX for ONTAP. O sistema de arquivos deve estar em uma região da AWS que tenha o Amazon bedrock habilitado.

  • Você precisará considerar os pares de chave/valor de tag que deseja aplicar aos recursos da AWS que fazem parte dessa implantação (opcional).

  • Você precisará saber as informações do par de chaves que permitem que você se conete com segurança à instância do mecanismo de IA do NetApp.