Implementare l'infrastruttura GenAI
Prima di creare knowledge base, connettori e applicazioni FSX per ONTAP per la tua organizzazione, devi implementare l'infrastruttura Genai per il framework RAG nel tuo ambiente. I componenti principali dell'infrastruttura sono il servizio Amazon Bedrock, un'istanza di macchina virtuale per il motore NetApp Genai e un file system FSX per ONTAP.
L'infrastruttura distribuita può supportare più knowledge base, chatbot e connettori, quindi in genere è necessario eseguire questa attività una sola volta.
Dettagli dell'infrastruttura
L'implementazione Genai deve trovarsi in una regione AWS con Amazon Bedrock abilitato. "Consente di visualizzare l'elenco delle regioni supportate"
L'infrastruttura è costituita dai seguenti componenti.
- Servizio Amazon Bedrock
-
Amazon Bedrock è un servizio completamente gestito che ti consente di utilizzare i modelli di base (FMS) di aziende di intelligenza artificiale leader attraverso una singola API. Fornisce inoltre le funzionalità necessarie per creare applicazioni ai generative sicure.
- Amazon Q Business
-
Amazon Q si basa su Amazon Bedrock per fornire un assistente ai generativo completamente gestito che puoi utilizzare per rispondere alle domande e generare contenuti sulla base delle informazioni provenienti dalle tue origini dati.
- Macchina virtuale per il motore NetApp Genai
-
Il motore NetApp Genai viene implementato durante questo processo. Fornisce la potenza di elaborazione per acquisire i dati dalle origini dati e poi scriverli nel database vettoriale.
- File system FSX per ONTAP
-
Il file system FSX per ONTAP offre lo storage per il tuo sistema GenAI.
Viene distribuito un singolo volume contenente il database vettoriale che memorizza i dati generati dal modello di base in base alle origini dati.
Le origini dati che integrerai nella tua knowledge base possono risiedere nello stesso file system FSX per ONTAP o su un sistema diverso.
Il motore NetApp Genai monitora e interagisce con entrambi questi volumi.
L'immagine seguente mostra l'infrastruttura GenAI. I componenti numerati 1, 2 e 3 vengono attivati durante questa procedura. Gli altri elementi devono essere presenti prima di iniziare la distribuzione.
Implementare l'infrastruttura GenAI
Dovrai inserire le tue credenziali AWS e selezionare il file system FSX per ONTAP per implementare l'infrastruttura di recupero e generazione aumentata (RAG).
Prima di iniziare la procedura, accertarsi che l'ambiente in uso soddisfi i requisiti delle knowledge base o dei connettori, a seconda di quale scelta si scelga.
-
Accedere a workload Factory utilizzando uno dei "esperienze di console".
-
Nella sezione carichi di lavoro ai, selezionare Deploy & Manage.
-
Esaminare il diagramma dell'infrastruttura e selezionare Avanti.
-
Completare gli elementi nella sezione Impostazioni AWS:
-
Credenziali AWS: Selezionare o aggiungere le credenziali AWS che forniscono le autorizzazioni per implementare le risorse AWS.
-
Posizione: Selezionare una regione AWS, un VPC e una subnet.
L'implementazione Genai deve trovarsi in una regione AWS con Amazon Bedrock abilitato. "Consente di visualizzare l'elenco delle regioni supportate"
-
-
Completare gli elementi nella sezione Impostazioni infrastruttura:
-
Tags: Immettere qualsiasi coppia di chiavi di tag/valori che si desidera applicare a tutte le risorse AWS che fanno parte di questa distribuzione. Questi tag sono visibili in AWS Management Console e nell'area di informazioni sull'infrastruttura all'interno della fabbrica del carico di lavoro e possono aiutarti a tenere traccia delle risorse di fabbrica del carico di lavoro.
-
-
Completare la sezione connettività:
-
Coppia di chiavi: Selezionare una coppia di chiavi che consente di connettersi in modo sicuro all'istanza del motore NetApp Genai.
-
-
Completare la sezione motore ai:
-
Nome istanza: Facoltativamente, selezionare Definisci nome istanza e immettere un nome personalizzato per l'istanza del motore ai. Il nome dell'istanza viene visualizzato in AWS Management Console e nell'area di informazioni sull'infrastruttura all'interno della fabbrica dei workload e può aiutarti a tenere traccia delle risorse di fabbrica dei workload.
-
-
Selezionare Deploy per iniziare la distribuzione.
Se la distribuzione non riesce con un errore di credenziali, è possibile ottenere ulteriori dettagli di errore selezionando i collegamenti ipertestuali all'interno del messaggio di errore. È possibile visualizzare un elenco di autorizzazioni mancanti o bloccate, nonché un elenco di autorizzazioni necessarie al carico di lavoro GenAI per poter implementare l'infrastruttura GenAI.
La fabbrica dei workload inizia a implementare l'infrastruttura chatbot. Questo processo può richiedere fino a 10 minuti.
Durante il processo di distribuzione, vengono impostati i seguenti elementi:
-
La rete viene impostata insieme agli endpoint privati.
-
Vengono creati il ruolo IAM, il profilo di istanza e il gruppo di protezione.
-
Viene implementata l'istanza della macchina virtuale per il motore GenAI.
-
Amazon Bedrock è configurato per inviare i registri ad Amazon CloudWatch Logs, utilizzando un gruppo di registri con il prefisso
/aws/bedrock/
. -
Il motore GenAI è configurato per inviare i registri ad Amazon CloudWatch Logs, utilizzando un gruppo di log con il nome
/netapp/wlmai/<tenancyAccountId>/randomId
, dove<tenancyAccountID>
è "ID dell'account BlueXP" per l'utente corrente.