了解NetApp Workload Factory for GenAI
NetApp Workload Factory for GenAI 讓您能夠將Amazon FSx for NetApp ONTAP檔案系統與 GenAI 基礎模型整合。這為您的 AI 資料集提供了高效能儲存以及豐富的保護、安全和成本優化功能。
NetApp Workload Factory for GenAI 是什麼?
NetApp Workload Factory for GenAI 讓您能夠將Amazon FSx for NetApp ONTAP上的企業資料來源與生成式 AI 應用程式結合使用。利用檢索增強生成 (RAG),您可以快速將資料來源連接到可透過 Amazon Bedrock 或 Amazon Q Business 獲得的基礎模型,以開發生成式 AI 驅動的應用程序,例如虛擬助理、問答聊天機器人、文件摘要、內容創建等。
將泛用 AI 與組織資料搭配使用、可讓您充分運用自己的知識和專業技能、而不只是仰賴模型所訓練的公開資料所提供的情報。使用 RAG 自訂模型可確保正確且相關地回應組織特定的問題、並使用泛化 AI 來提高應用程式使用者的生產力與效率。
開發專為貴組織資料量身打造的 GenAI 應用程式、可讓您充分運用自己的知識與專業技能。這項自訂功能可確保準確且相關地回應組織特定問題、提高所有使用者的滿意度與生產力。
如果您"建立知識庫"是, GenAI 會從資料來源擷取資料,將向量化的結果儲存在資料庫中,並讓您完全掌控如何使用擷取的資料來回答查詢。此方法需要更多初始設定,但可讓您針對不同的結果選擇不同的聊天模式。如果您"為 Amazon Q Business 定義 NetApp 連接器"是, Amazon Q Business 會擷取資料來源的資料,並儲存在索引中。這種方法需要較少的初始組態,但對結果的控制較少。
有關 Workload Factory 的更多信息,請參閱 "工作負載工廠概述"。
使用 GenAI 建立泛用 AI 應用程式的優點
NetApp Workload Factory for GenAI 簡化了使用檢索增強生成 (RAG) 建立生成式 AI 應用程式所需的基礎架構的部署過程。具體來說,GenAI 具有以下優勢:
-
無需深入瞭解資料基礎架構、基礎和語言模型、 IT 管理員和開發人員就能利用 GenAI 提供的自動化功能來加速應用程式開發。資料管理員和開發人員可以輕鬆快速地建立企業知識庫、將組織的非結構化資料內嵌在其中、供泛化 AI 應用程式使用。
-
保留內嵌於知識庫之檔案的使用者權限、以確保資料安全性與隱私權得以維持、進而提升安全性。開發應用程式(例如 chatbot )時、只能根據使用者存取的資料、提供經過驗證的使用者答案。
-
將企業資料保密、安全地存放在 AWS 客戶帳戶內、讓您的組織資料永遠不會暴露在外部。
-
使用開放原始碼架構(例如 LangChain )加速開發 GenAI 應用程式(例如 Q&A 聊天機器人),利用 GenAI API 來配置和管理知識庫和連接器,與知識庫聊天,以及儲存和擷取聊天記錄。
-
透過在適用於 NetApp ONTAP 檔案系統的 FSX 上部署泛用 AI 資料基礎架構、並利用 ONTAP 功能(例如高可用度、用於本機資料保護與恢復的快照、用於災難恢復的 SnapMirror 、以及用於備份資料基礎架構的 SnapVault )來改善資料保護與可用度。
-
利用 ONTAP 資料效率功能(例如重複資料刪除、壓縮和壓縮、資料分層和精簡配置)、降低通用 AI 資料基礎架構的整體儲存成本。
-
利用 GenAI 提供的混合式搜尋和重新排名功能,從您的資料中獲得高品質結果。混合式搜尋結合重新排名,可大幅提升搜尋結果的相關性。這些功能可透過 Amazon AWS 取得,且因地區而定。
GenAI 的運作方式
GenAI 使用貴組織的私有資料來輔助模型的智慧(根據訓練的資料)、針對貴組織中的使用者所提出的問題提供自訂答案。您先部署 RAG 架構所需的基礎架構,然後建立知識庫,或使用貴組織透過 Amazon Bedrock 或 Amazon Q Business 提供的資料來源和基礎模型來定義連接器,然後將應用程式(例如 Q&A 聊天機器人程式)連接到知識庫或連接器。

NetApp Workload Factory for GenAI 如何協助建立生成式 AI 應用程式
GenAI 以下列方式協助使用 RAG 建置泛型 AI 應用程式:
-
部署所需的基礎架構,以便擷取擴增型世代( RAG )架構,以處理適用於 ONTAP 檔案系統和 Amazon Beedrock 或 Amazon Q Business 的 FSX 資料來源。基礎架構包括用於管理資料的 NetApp GenAI Engine 執行個體、內嵌向量資料庫( LanceDB )、以及用於向量資料庫的 FSX for ONTAP 檔案系統上的儲存設備。
-
協助將資料來源連接至 Amazon bedrock 或 Amazon Q Business 提供的嵌入資料來源和語言模型,以擷取使用者查詢的回應。資料來源及模型及其組態會顯示為適用於 ONTAP 知識庫的 FSX 。
-
將來源資料擷取至知識庫或連接器,以便將來源檔案內嵌於 SMB 共用上,並將 NFS 匯出至 ONTAP 檔案系統的 FSX ,同時儲存 SMB 共用中檔案的檔案權限。
-
根據知識庫中的內容,自動建立對話入門問題。
-
為資料管理員提供聊天模擬器,以測試與知識庫的聊天。
-
提供簡單的連接器介面,讓您可以快速輕鬆地使用此 AI 助理的功能,將 GenAI 與 Amazon Q Business 連線。
使用NetApp Workload Factory 的工具
您可以將NetApp Workload Factory 與以下工具一起使用:
-
Workload Factory 控制台:Workload Factory 控制台提供您的應用程式和專案的視覺化、整體視圖。
-
* NetApp控制台*: NetApp控制台提供混合介面體驗,以便您可以將 Workload Factory 與其他NetApp資料服務一起使用。
-
問我:使用問我 AI 助理來提問並了解有關 Workload Factory 的更多信息,而無需離開 Workload Factory 控制台。從 Workload Factory 幫助選單中存取「問我」。
-
CloudShell CLI:Workload Factory 包含 CloudShell CLI,可透過基於瀏覽器的單一 CLI 跨帳號管理和操作 AWS 和NetApp環境。從 Workload Factory 控制台頂部欄存取 CloudShell。
-
REST API:使用 Workload Factory REST API 部署和管理您的 FSx for ONTAP檔案系統和其他 AWS 資源。
-
CloudFormation:使用 AWS CloudFormation 程式碼執行您在 Workload Factory 控制台中定義的操作,以從您的 AWS 帳戶中的 CloudFormation 堆疊對 AWS 和第三方資源進行建模、配置和管理。
-
Terraform NetApp Workload Factory 提供者:使用 Terraform 建置和管理在 Workload Factory 控制台中產生的基礎架構工作流程。
成本
使用 Workload Factory 的 GenAI 功能無需任何成本。
不過、您必須支付所部署的 AWS 資源、才能支援泛用 AI 基礎架構。例如,您將為 Amazon Bedrock 或 Amazon Q Business , ONTAP 檔案系統和儲存容量的 FSX ,以及 GenAI 引擎 EC2 執行個體支付 AWS 費用。
某些多模式作業(例如掃描影像以取得文字資訊)可能會使用更多資源,因此會產生較高的成本。某些組態作業(例如變更知識庫的設定)可能會導致重新掃描資料來源,而且資料來源掃描也會產生較高的成本。
授權
無需NetApp的特殊授權即可使用 Workload Factory 的 AI 功能。
區域
所有支援 FSx for ONTAP 的商業區域均支援 Workload Factory。"看看支援的亞馬遜區域。"
以下 AWS 區域不受支援:
-
中國地區
-
GovCloud(美國)區域
-
秘密雲
-
絕密雲