Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Implementare l'infrastruttura GenAI

Collaboratori netapp-mwallis

Prima di creare knowledge base, connettori e applicazioni FSX per ONTAP per la tua organizzazione, devi implementare l'infrastruttura Genai per il framework RAG nel tuo ambiente. I componenti principali dell'infrastruttura sono il servizio Amazon Bedrock, un'istanza di macchina virtuale per il motore NetApp Genai e un file system FSX per ONTAP.

L'infrastruttura distribuita può supportare più knowledge base, chatbot e connettori, quindi in genere è necessario eseguire questa attività una sola volta.

Dettagli dell'infrastruttura

L'implementazione Genai deve trovarsi in una regione AWS con Amazon Bedrock abilitato. "Consente di visualizzare l'elenco delle regioni supportate"

L'infrastruttura è costituita dai seguenti componenti.

Servizio Amazon Bedrock

Amazon Bedrock è un servizio completamente gestito che ti consente di utilizzare i modelli di base (FMS) di aziende di intelligenza artificiale leader attraverso una singola API. Fornisce inoltre le funzionalità necessarie per creare applicazioni ai generative sicure.

Amazon Q Business

Amazon Q si basa su Amazon Bedrock per fornire un assistente ai generativo completamente gestito che puoi utilizzare per rispondere alle domande e generare contenuti sulla base delle informazioni provenienti dalle tue origini dati.

Macchina virtuale per il motore NetApp Genai

Il motore NetApp Genai viene implementato durante questo processo. Fornisce la potenza di elaborazione per acquisire i dati dalle origini dati e poi scriverli nel database vettoriale.

File system FSX per ONTAP

Il file system FSX per ONTAP offre lo storage per il tuo sistema GenAI.

Viene distribuito un singolo volume contenente il database vettoriale che memorizza i dati generati dal modello di base in base alle origini dati.

Le origini dati che integrerai nella tua knowledge base possono risiedere nello stesso file system FSX per ONTAP o su un sistema diverso.

Il motore NetApp Genai monitora e interagisce con entrambi questi volumi.

L'immagine seguente mostra l'infrastruttura GenAI. I componenti numerati 1, 2 e 3 vengono attivati durante questa procedura. Gli altri elementi devono essere presenti prima di iniziare la distribuzione.

Un diagramma dei componenti dell'infrastruttura GenAI.

Implementare l'infrastruttura GenAI

Dovrai inserire le tue credenziali AWS e selezionare il file system FSX per ONTAP per implementare l'infrastruttura di recupero e generazione aumentata (RAG).

Prima di iniziare

Prima di iniziare la procedura, accertarsi che l'ambiente in uso soddisfi i requisiti delle knowledge base o dei connettori, a seconda di quale scelta si scelga.

Fasi
  1. Accedere a workload Factory utilizzando uno dei "esperienze di console".

  2. Nella sezione carichi di lavoro ai, selezionare Deploy & Manage.

  3. Esaminare il diagramma dell'infrastruttura e selezionare Avanti.

  4. Completare gli elementi nella sezione Impostazioni AWS:

    1. Credenziali AWS: Selezionare o aggiungere le credenziali AWS che forniscono le autorizzazioni per implementare le risorse AWS.

    2. Posizione: Selezionare una regione AWS, un VPC e una subnet.

      L'implementazione Genai deve trovarsi in una regione AWS con Amazon Bedrock abilitato. "Consente di visualizzare l'elenco delle regioni supportate"

  5. Completare gli elementi nella sezione Impostazioni infrastruttura:

    1. Tags: Immettere qualsiasi coppia di chiavi di tag/valori che si desidera applicare a tutte le risorse AWS che fanno parte di questa distribuzione. Questi tag sono visibili in AWS Management Console e nell'area di informazioni sull'infrastruttura all'interno della fabbrica del carico di lavoro e possono aiutarti a tenere traccia delle risorse di fabbrica del carico di lavoro.

  6. Completare la sezione connettività:

    1. Coppia di chiavi: Selezionare una coppia di chiavi che consente di connettersi in modo sicuro all'istanza del motore NetApp Genai.

  7. Completare la sezione motore ai:

    1. Nome istanza: Facoltativamente, selezionare Definisci nome istanza e immettere un nome personalizzato per l'istanza del motore ai. Il nome dell'istanza viene visualizzato in AWS Management Console e nell'area di informazioni sull'infrastruttura all'interno della fabbrica dei workload e può aiutarti a tenere traccia delle risorse di fabbrica dei workload.

  8. Selezionare Deploy per iniziare la distribuzione.

    Nota Se la distribuzione non riesce con un errore di credenziali, è possibile ottenere ulteriori dettagli di errore selezionando i collegamenti ipertestuali all'interno del messaggio di errore. È possibile visualizzare un elenco di autorizzazioni mancanti o bloccate, nonché un elenco di autorizzazioni necessarie al carico di lavoro GenAI per poter implementare l'infrastruttura GenAI.
Risultato

La fabbrica dei workload inizia a implementare l'infrastruttura chatbot. Questo processo può richiedere fino a 10 minuti.

Durante il processo di distribuzione, vengono impostati i seguenti elementi:

  • La rete viene impostata insieme agli endpoint privati.

  • Vengono creati il ruolo IAM, il profilo di istanza e il gruppo di protezione.

  • Viene implementata l'istanza della macchina virtuale per il motore GenAI.

  • Amazon Bedrock è configurato per inviare i registri ad Amazon CloudWatch Logs, utilizzando un gruppo di registri con il prefisso /aws/bedrock/.

  • Il motore GenAI è configurato per inviare i registri ad Amazon CloudWatch Logs, utilizzando un gruppo di log con il nome /netapp/wlmai/<tenancyAccountId>/randomId, dove <tenancyAccountID> è "ID dell'account BlueXP" per l'utente corrente.