部署 GenAI 基礎架構
您必須先在環境中部署適用於 RAG 架構的 GenAI 基礎架構,才能為組織建置適用於 ONTAP 知識庫,連接器和應用程式的 FSX 。主要基礎架構元件為 Amazon 基礎架構服務、 NetApp GenAI 引擎的虛擬機器執行個體、以及 ONTAP 檔案系統的 FSX 。
部署的基礎架構可支援多個知識庫,閒聊機器人程式和連接器,因此您通常只需要執行一次此工作。
基礎架構詳細資料
您的 GenAI 部署必須位於啟用 Amazon 基礎的 AWS 區域。 "檢視支援區域的清單"
基礎架構包含下列元件。
- Amazon bedrock 服務
-
Amazon bedrock 是一項完全託管的服務、可讓您透過單一 API 使用來自頂尖 AI 公司的基礎模型( FMS )。它也提供您建置安全泛用 AI 應用程式所需的功能。
- Amazon Q Business
-
Amazon Q 以 Amazon 為基礎,提供完全託管的泛型 AI 助理,可用於回答問題,並根據資料來源的資訊產生內容。
- NetApp GenAI 引擎的虛擬機器
-
NetApp GenAI 引擎會在此程序中部署。它提供從資料來源擷取資料的處理能力、然後將該資料寫入向量資料庫。
- 適用於 ONTAP 檔案系統的 FSX
-
適用於 ONTAP 檔案系統的 FSX 可為您的 GenAI 系統提供儲存設備。
部署的單一 Volume 會包含向量資料庫、其中會儲存基礎模型根據您的資料來源所產生的資料。
您將整合至知識庫的資料來源可以位於 ONTAP 檔案系統的相同 FSX 或不同系統上。
NetApp GenAI 引擎會監控並與這兩個磁碟區互動。
下圖顯示 GenAI 基礎架構。編號 1 、 2 和 3 的元件會在此程序中部署。開始部署之前、必須先具備其他元素。
部署 GenAI 基礎架構
您需要輸入 AWS 認證資料,然後選取適用於 ONTAP 檔案系統的 FSX ,以部署擷取擴增產生( RAG )基礎架構。
開始此程序之前,請確定您的環境符合知識庫或連接器的需求,視您選擇的類型而定。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
在 AI 工作負載方塊中、選取 * 部署與管理 * 。
-
檢閱基礎架構圖表、然後選取 * 下一步 * 。
-
完成「 * AWS 設定 * 」區段中的項目:
-
* AWS 認證 * :選取或新增 AWS 認證、以提供部署 AWS 資源的權限。
-
* 位置 * :選取 AWS 區域、 VPC 和子網路。
GenAI 部署必須位於啟用 Amazon 基礎的 AWS 區域。 "檢視支援區域的清單"
-
-
完成 * 基礎架構設定 * 區段中的項目:
-
* 標記 * :輸入您要套用至此部署中所有 AWS 資源的任何標記金鑰 / 值配對。這些標籤可在 AWS 管理主控台和工作負載工廠內的基礎架構資訊區域中看到,並可協助您追蹤工作負載原廠資源。
-
-
完成 Connectivity 部分:
-
* 金鑰配對 * :選取金鑰配對、讓您安全地連線至 NetApp GenAI 引擎執行個體。
-
-
完成「 *AI 引擎 * 」一節:
-
* 執行個體名稱 * :選擇性地選取 * 定義執行個體名稱 * ,然後輸入 AI 引擎執行個體的自訂名稱。執行個體名稱會出現在 AWS 管理主控台,以及工作負載工廠內的基礎架構資訊區域,可協助您追蹤工作負載原廠資源。
-
-
選擇 * 部署 * 開始部署。
如果部署失敗並出現認證錯誤,您可以選取錯誤訊息中的超連結,以取得進一步的錯誤詳細資料。您可以查看遺失或封鎖的權限清單,以及 GenAI 工作負載需要的權限清單,以便部署 GenAI 基礎架構。
工作負載工廠開始部署 chatbot 基礎架構。此程序最多可能需要10分鐘。
在部署過程中、會設定下列項目:
-
網路與私有端點一起設定。
-
隨即建立 IAM 角色、執行個體設定檔和安全性群組。
-
已部署 GenAI 引擎的虛擬機器執行個體。
-
Amazon bedrock 已設定為使用前置字元的記錄群組、將記錄傳送至 Amazon CloudWatch 記錄檔
/aws/bedrock/
。 -
GenAI 引擎已設定為使用名稱為的記錄群組、將記錄傳送至 Amazon CloudWatch 記錄檔
/netapp/wlmai/<tenancyAccountId>/randomId
、其中<tenancyAccountID>
是 "BlueXP 帳戶 ID" 目前使用者的。