Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

部署 GenAI 基礎架構

貢獻者 netapp-mwallis

您必須先在環境中部署適用於 RAG 架構的 GenAI 基礎架構,才能為組織建置適用於 ONTAP 知識庫,連接器和應用程式的 FSX 。主要基礎架構元件為 Amazon 基礎架構服務、 NetApp GenAI 引擎的虛擬機器執行個體、以及 ONTAP 檔案系統的 FSX 。

部署的基礎架構可支援多個知識庫,閒聊機器人程式和連接器,因此您通常只需要執行一次此工作。

基礎架構詳細資料

您的 GenAI 部署必須位於啟用 Amazon 基礎的 AWS 區域。 "檢視支援區域的清單"

基礎架構包含下列元件。

Amazon bedrock 服務

Amazon bedrock 是一項完全託管的服務、可讓您透過單一 API 使用來自頂尖 AI 公司的基礎模型( FMS )。它也提供您建置安全泛用 AI 應用程式所需的功能。

Amazon Q Business

Amazon Q 以 Amazon 為基礎,提供完全託管的泛型 AI 助理,可用於回答問題,並根據資料來源的資訊產生內容。

NetApp GenAI 引擎的虛擬機器

NetApp GenAI 引擎會在此程序中部署。它提供從資料來源擷取資料的處理能力、然後將該資料寫入向量資料庫。

適用於 ONTAP 檔案系統的 FSX

適用於 ONTAP 檔案系統的 FSX 可為您的 GenAI 系統提供儲存設備。

部署的單一 Volume 會包含向量資料庫、其中會儲存基礎模型根據您的資料來源所產生的資料。

您將整合至知識庫的資料來源可以位於 ONTAP 檔案系統的相同 FSX 或不同系統上。

NetApp GenAI 引擎會監控並與這兩個磁碟區互動。

下圖顯示 GenAI 基礎架構。編號 1 、 2 和 3 的元件會在此程序中部署。開始部署之前、必須先具備其他元素。

GenAI 基礎架構元件的圖表。

部署 GenAI 基礎架構

您需要輸入 AWS 認證資料,然後選取適用於 ONTAP 檔案系統的 FSX ,以部署擷取擴增產生( RAG )基礎架構。

開始之前

開始此程序之前,請確定您的環境符合知識庫或連接器的需求,視您選擇的類型而定。

步驟
  1. 使用其中一項登入工作負載工廠"主控台體驗"

  2. 在 AI 工作負載方塊中、選取 * 部署與管理 * 。

  3. 檢閱基礎架構圖表、然後選取 * 下一步 * 。

  4. 完成「 * AWS 設定 * 」區段中的項目:

    1. * AWS 認證 * :選取或新增 AWS 認證、以提供部署 AWS 資源的權限。

    2. * 位置 * :選取 AWS 區域、 VPC 和子網路。

      GenAI 部署必須位於啟用 Amazon 基礎的 AWS 區域。 "檢視支援區域的清單"

  5. 完成 * 基礎架構設定 * 區段中的項目:

    1. * 標記 * :輸入您要套用至此部署中所有 AWS 資源的任何標記金鑰 / 值配對。這些標籤可在 AWS 管理主控台和工作負載工廠內的基礎架構資訊區域中看到,並可協助您追蹤工作負載原廠資源。

  6. 完成 Connectivity 部分:

    1. * 金鑰配對 * :選取金鑰配對、讓您安全地連線至 NetApp GenAI 引擎執行個體。

  7. 完成「 *AI 引擎 * 」一節:

    1. * 執行個體名稱 * :選擇性地選取 * 定義執行個體名稱 * ,然後輸入 AI 引擎執行個體的自訂名稱。執行個體名稱會出現在 AWS 管理主控台,以及工作負載工廠內的基礎架構資訊區域,可協助您追蹤工作負載原廠資源。

  8. 選擇 * 部署 * 開始部署。

    註 如果部署失敗並出現認證錯誤,您可以選取錯誤訊息中的超連結,以取得進一步的錯誤詳細資料。您可以查看遺失或封鎖的權限清單,以及 GenAI 工作負載需要的權限清單,以便部署 GenAI 基礎架構。
結果

工作負載工廠開始部署 chatbot 基礎架構。此程序最多可能需要10分鐘。

在部署過程中、會設定下列項目:

  • 網路與私有端點一起設定。

  • 隨即建立 IAM 角色、執行個體設定檔和安全性群組。

  • 已部署 GenAI 引擎的虛擬機器執行個體。

  • Amazon bedrock 已設定為使用前置字元的記錄群組、將記錄傳送至 Amazon CloudWatch 記錄檔 /aws/bedrock/

  • GenAI 引擎已設定為使用名稱為的記錄群組、將記錄傳送至 Amazon CloudWatch 記錄檔 /netapp/wlmai/<tenancyAccountId>/randomId、其中 <tenancyAccountID>"BlueXP 帳戶 ID" 目前使用者的。