Implementare l'infrastruttura GenAI
Prima di creare knowledge base, connettori e applicazioni FSX per ONTAP per la tua organizzazione, devi implementare l'infrastruttura Genai per il framework RAG nel tuo ambiente. I componenti principali dell'infrastruttura sono il servizio Amazon Bedrock, un'istanza di macchina virtuale per il motore NetApp Genai e un file system FSX per ONTAP.
L'infrastruttura distribuita può supportare più knowledge base, chatbot e connettori, quindi in genere è necessario eseguire questa attività una sola volta.
Dettagli dell'infrastruttura
L'implementazione Genai deve trovarsi in una regione AWS con Amazon Bedrock abilitato. "Consente di visualizzare l'elenco delle regioni supportate"
L'infrastruttura è costituita dai seguenti componenti.
- Servizio Amazon Bedrock
-
Amazon Bedrock è un servizio completamente gestito che ti consente di utilizzare i modelli di base (FMS) di aziende di intelligenza artificiale leader attraverso una singola API. Fornisce inoltre le funzionalità necessarie per creare applicazioni ai generative sicure.
- Amazon Q Business
-
Amazon Q si basa su Amazon Bedrock per fornire un assistente ai generativo completamente gestito che puoi utilizzare per rispondere alle domande e generare contenuti sulla base delle informazioni provenienti dalle tue origini dati.
- Macchina virtuale per il motore NetApp Genai
-
Il motore NetApp Genai viene implementato durante questo processo. Fornisce la potenza di elaborazione per acquisire i dati dalle origini dati e poi scriverli nel database vettoriale.
- File system FSX per ONTAP
-
Il file system FSX per ONTAP offre lo storage per il tuo sistema GenAI.
Viene distribuito un singolo volume contenente il database vettoriale che memorizza i dati generati dal modello di base in base alle origini dati.
Le origini dati che integrerai nella tua knowledge base possono risiedere nello stesso file system FSX per ONTAP o su un sistema diverso.
Il motore NetApp Genai monitora e interagisce con entrambi questi volumi.
L'immagine seguente mostra l'infrastruttura GenAI. I componenti numerati 1, 2 e 3 vengono attivati durante questa procedura. Gli altri elementi devono essere presenti prima di iniziare la distribuzione.

Implementare l'infrastruttura GenAI
Dovrai inserire le tue credenziali AWS e selezionare il file system FSX per ONTAP per implementare l'infrastruttura di recupero e generazione aumentata (RAG).
Prima di iniziare la procedura, accertarsi che l'ambiente in uso soddisfi i requisiti delle knowledge base o dei connettori, a seconda di quale scelta si scelga.
-
Accedi a Workload Factory utilizzando uno dei"esperienze di console" .
-
Nella sezione carichi di lavoro ai, selezionare Deploy & Manage.
-
Esaminare il diagramma dell'infrastruttura e selezionare Avanti.
-
Completare gli elementi nella sezione Impostazioni AWS:
-
Credenziali AWS: Selezionare o aggiungere le credenziali AWS che forniscono le autorizzazioni per implementare le risorse AWS.
-
Posizione: Selezionare una regione AWS, un VPC e una subnet.
L'implementazione Genai deve trovarsi in una regione AWS con Amazon Bedrock abilitato. "Consente di visualizzare l'elenco delle regioni supportate"
-
-
Completare gli elementi nella sezione Impostazioni infrastruttura:
-
Tag: inserisci le coppie chiave/valore dei tag che desideri applicare a tutte le risorse AWS che fanno parte di questa distribuzione. Questi tag sono visibili nella AWS Management Console e nell'area delle informazioni sull'infrastruttura all'interno di Workload Factory e possono aiutarti a tenere traccia delle risorse di Workload Factory.
-
-
Completare la sezione connettività:
-
Coppia di chiavi: Selezionare una coppia di chiavi che consente di connettersi in modo sicuro all'istanza del motore NetApp Genai.
-
-
Completare la sezione motore ai:
-
Nome istanza: facoltativamente, seleziona Definisci nome istanza e inserisci un nome personalizzato per l'istanza del motore AI. Il nome dell'istanza appare nella AWS Management Console e nell'area delle informazioni sull'infrastruttura all'interno di Workload Factory e può aiutarti a tenere traccia delle risorse di Workload Factory.
-
-
Selezionare Deploy per iniziare la distribuzione.
Se la distribuzione non riesce con un errore di credenziali, è possibile ottenere ulteriori dettagli di errore selezionando i collegamenti ipertestuali all'interno del messaggio di errore. È possibile visualizzare un elenco di autorizzazioni mancanti o bloccate, nonché un elenco di autorizzazioni necessarie al carico di lavoro GenAI per poter implementare l'infrastruttura GenAI.
Workload Factory inizia a distribuire l'infrastruttura del chatbot. Questo processo può richiedere fino a 10 minuti.
Durante il processo di distribuzione, vengono impostati i seguenti elementi:
-
La rete viene impostata insieme agli endpoint privati.
-
Vengono creati il ruolo IAM, il profilo di istanza e il gruppo di protezione.
-
Viene implementata l'istanza della macchina virtuale per il motore GenAI.
-
Amazon Bedrock è configurato per inviare i registri ad Amazon CloudWatch Logs, utilizzando un gruppo di registri con il prefisso
/aws/bedrock/. -
Il motore GenAI è configurato per inviare log ad Amazon CloudWatch Logs, utilizzando un gruppo di log con il nome
/netapp/wlmai/<tenancyAccountId>/randomId, Dove<tenancyAccountID>è il "ID account console NetApp" per l'utente corrente.