Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

瞭解 GenAI 的 BlueXP  工作負載工廠

貢獻者 netapp-mwallis

BlueXP  Workload Factory for GenAI 可讓您將適用於 NetApp ONTAP 檔案系統的 Amazon FSX 與 GenAI 基礎模型整合。這可為您提供高效能儲存設備、並針對 AI 資料集提供豐富的保護、安全性和成本最佳化功能。

什麼是 GenAI 的 BlueXP  工作負載工廠?

BlueXP  Workload Factory for GenAI 可讓您在 Amazon FSX for NetApp ONTAP 上使用企業資料來源,搭配泛用 AI 應用程式。利用擷取擴增世代( RAG ),您可以快速將資料來源連接至 Amazon Bedrock 或 Amazon Q Business 提供的基礎模型,以開發具泛用性的 AI 驅動應用程式,例如虛擬助理,問答聊天機器人程式,文件摘要,內容建立等

將泛用 AI 與組織資料搭配使用、可讓您充分運用自己的知識和專業技能、而不只是仰賴模型所訓練的公開資料所提供的情報。使用 RAG 自訂模型可確保正確且相關地回應組織特定的問題、並使用泛化 AI 來提高應用程式使用者的生產力與效率。

開發專為貴組織資料量身打造的 GenAI 應用程式、可讓您充分運用自己的知識與專業技能。這項自訂功能可確保準確且相關地回應組織特定問題、提高所有使用者的滿意度與生產力。

如果您"建立知識庫"是, GenAI 會從資料來源擷取資料,將向量化的結果儲存在資料庫中,並讓您完全掌控如何使用擷取的資料來回答查詢。此方法需要更多初始設定,但可讓您針對不同的結果選擇不同的聊天模式。如果您"為 Amazon Q Business 定義 NetApp 連接器"是, Amazon Q Business 會擷取資料來源的資料,並儲存在索引中。這種方法需要較少的初始組態,但對結果的控制較少。

如需工作負載工廠的詳細資訊,請 "工作負載原廠總覽"參閱。

使用 GenAI 建立泛用 AI 應用程式的優點

BlueXP  Workload Factory for GenAI 使用擷取擴充世代( RAG ),簡化部署基礎架構所需的程序,以建置泛用 AI 應用程式。具體而言、 GenAI 提供下列優點:

  • 無需深入瞭解資料基礎架構、基礎和語言模型、 IT 管理員和開發人員就能利用 GenAI 提供的自動化功能來加速應用程式開發。資料管理員和開發人員可以輕鬆快速地建立企業知識庫、將組織的非結構化資料內嵌在其中、供泛化 AI 應用程式使用。

  • 保留內嵌於知識庫之檔案的使用者權限、以確保資料安全性與隱私權得以維持、進而提升安全性。開發應用程式(例如 chatbot )時、只能根據使用者存取的資料、提供經過驗證的使用者答案。

  • 將企業資料保密、安全地存放在 AWS 客戶帳戶內、讓您的組織資料永遠不會暴露在外部。

  • 使用開放原始碼架構(例如 LangChain )加速開發 GenAI 應用程式(例如 Q&A 聊天機器人),利用 GenAI API 來配置和管理知識庫和連接器,與知識庫聊天,以及儲存和擷取聊天記錄。

  • 透過在適用於 NetApp ONTAP 檔案系統的 FSX 上部署泛用 AI 資料基礎架構、並利用 ONTAP 功能(例如高可用度、用於本機資料保護與恢復的快照、用於災難恢復的 SnapMirror 、以及用於備份資料基礎架構的 SnapVault )來改善資料保護與可用度。

  • 利用 ONTAP 資料效率功能(例如重複資料刪除、壓縮和壓縮、資料分層和精簡配置)、降低通用 AI 資料基礎架構的整體儲存成本。

  • 利用 GenAI 提供的混合式搜尋和重新排名功能,從您的資料中獲得高品質結果。混合式搜尋結合重新排名,可大幅提升搜尋結果的相關性。這些功能可透過 Amazon AWS 取得,且因地區而定。

GenAI 的運作方式

GenAI 使用貴組織的私有資料來輔助模型的智慧(根據訓練的資料)、針對貴組織中的使用者所提出的問題提供自訂答案。您先部署 RAG 架構所需的基礎架構,然後建立知識庫,或使用貴組織透過 Amazon Bedrock 或 Amazon Q Business 提供的資料來源和基礎模型來定義連接器,然後將應用程式(例如 Q&A 聊天機器人程式)連接到知識庫或連接器。

顯示 GenAI 關鍵元件、其功能及運作方式的圖表。

GenAI 的 BlueXP  工作負載工廠如何協助建置泛用 AI 應用程式

GenAI 以下列方式協助使用 RAG 建置泛型 AI 應用程式:

  • 部署所需的基礎架構,以便擷取擴增型世代( RAG )架構,以處理適用於 ONTAP 檔案系統和 Amazon Beedrock 或 Amazon Q Business 的 FSX 資料來源。基礎架構包括用於管理資料的 NetApp GenAI Engine 執行個體、內嵌向量資料庫( LanceDB )、以及用於向量資料庫的 FSX for ONTAP 檔案系統上的儲存設備。

  • 協助將資料來源連接至 Amazon bedrock 或 Amazon Q Business 提供的嵌入資料來源和語言模型,以擷取使用者查詢的回應。資料來源及模型及其組態會顯示為適用於 ONTAP 知識庫的 FSX 。

  • 將來源資料擷取至知識庫或連接器,以便將來源檔案內嵌於 SMB 共用上,並將 NFS 匯出至 ONTAP 檔案系統的 FSX ,同時儲存 SMB 共用中檔案的檔案權限。

  • 根據知識庫中的內容,自動建立對話入門問題。

  • 為資料管理員提供聊天模擬器,以測試與知識庫的聊天。

  • 提供簡單的連接器介面,讓您可以快速輕鬆地使用此 AI 助理的功能,將 GenAI 與 Amazon Q Business 連線。

使用工作負載工廠的工具

您可以搭配下列工具使用 BlueXP  工作負載工廠:

  • * 工作負載原廠主控台 * :工作負載原廠主控台可提供應用程式與專案的視覺化整體檢視。

  • * BlueXP  console* : BlueXP  主控台提供混合式介面體驗,讓您可以將 BlueXP  工作負載工廠與其他 BlueXP  服務一起使用。

  • * 詢問我 * :使用「詢問我 AI 」助理來詢問問題,並深入瞭解工作負載工廠,而無需離開工作負載工廠的網路 UI 。從工作負載原廠說明功能表存取 Ask me 。

  • * CloudShell CL1* :工作負載工廠包含 CloudShell CLI ,可透過單一瀏覽器型 CLI ,跨帳戶管理及操作 AWS 和 NetApp 環境。從工作負載原廠主控台的頂端列存取 CloudShell 。

  • * REST API* :使用工作負載原廠 REST API 來部署及管理適用於 ONTAP 檔案系統和其他 AWS 資源的 FSX 。

  • * CloudForgius* :使用 AWS CloudForgation 程式碼來執行您在工作負載工廠主控台中定義的動作,以便在 AWS 帳戶中建構,配置及管理 CloudForgation 堆疊中的 AWS 和第三方資源。

  • * Terraform BlueXP  工作負載工廠供應商 * :使用 Terraform 建置及管理在工作負載工廠主控台產生的基礎架構工作流程。

成本

使用工作負載工廠的 GenAI 功能不需花費任何成本。

不過、您必須支付所部署的 AWS 資源、才能支援泛用 AI 基礎架構。例如,您將為 Amazon Bedrock 或 Amazon Q Business , ONTAP 檔案系統和儲存容量的 FSX ,以及 GenAI 引擎 EC2 執行個體支付 AWS 費用。

某些多模式作業(例如掃描影像以取得文字資訊)可能會使用更多資源,因此會產生較高的成本。某些組態作業(例如變更知識庫的設定)可能會導致重新掃描資料來源,而且資料來源掃描也會產生較高的成本。

授權

NetApp 不需要特殊授權即可使用工作負載工廠的 AI 功能。