建立 GenAI 知識庫
部署 AI 基礎架構並確定將從 FSx for ONTAP資料儲存整合到知識庫中的資料來源後,您就可以使用 Workload Factory 建置知識庫了。作為此步驟的一部分,您還將定義 AI 特性並建立對話開場白。
請確保您的環境符合 "需求"for 知識庫,然後再繼續。
知識庫有兩種資料整合模式: _ 公開模式 _ 和 _ 企業模式 _ 。
- 公共模式
-
您可以使用知識庫、而無需整合組織的資料來源。在這種情況下、與知識庫整合的應用程式只會提供來自網際網路上公開資訊的結果。這稱為 _public 模式 _ 整合。
- 企業模式
-
在大多數情況下、您會想要將組織的資料來源整合到知識庫中。這稱為 _ 企業模式 _ 整合、因為它能提供企業的知識。
您組織的資料來源可能包含個人識別資訊 (PII)。為了保護這些敏感訊息,您可以在建立和配置知識庫時啟用_資料護欄_。由NetApp資料分類提供支援的資料護欄可識別和屏蔽 PII,使其無法存取和復原。
NetApp Workload Factory for GenAI 不會屏蔽敏感的個人資訊 (SPii)。參考"敏感個人資料的類型"有關此類數據的更多資訊。 數據護欄可以隨時啟用或停用。如果您切換資料護欄啟用,Workload Factory 將從頭開始掃描整個知識庫,這會產生成本。
建立及設定知識庫
知識庫定義了您想要用來建立知識庫的特性、例如基礎 AI 模型和內嵌格式。
-
使用以下方式之一登入 Workload Factory"主控台體驗" 。
-
在 AI 工作負載方塊中、選取 * 部署與管理 * 。
-
從知識庫和連接器選單中,選擇*新建*下拉選單並選擇* NetApp GenAI 知識庫 for Bedrock*。
-
在建立NetApp GenAI 知識庫頁面上,設定知識庫設定:
知識庫詳細資訊
-
* 名稱 * :輸入您要用於知識庫的名稱。
-
* 說明 * :輸入知識庫的詳細說明。
-
Bedrock:選擇您的 AWS 帳號可使用 Amazon Bedrock 的區域。
攝取
-
嵌入模型:
-
選擇一個嵌入模型用於知識庫。嵌入模型定義如何將資料轉換為知識庫的向量嵌入。 Workload Factory 支援以下模型:
-
Titan 嵌入式 G1 - 文字
-
Titan 內嵌文字 v2
-
Titan Multic形式 嵌入式 G1
-
內嵌英文
-
內嵌多國語言
請注意、您必須已啟用 Amazon bedrock 的內嵌模型。
-
如果適用,請選擇與所選嵌入模型的配置相符的推理類型。
-
-
資料護欄:選擇是否要啟用或停用資料護欄。"了解由NetApp資料分類提供支援的資料護欄" 。
必須符合下列先決條件,才能啟用資料欄。
-
需要服務帳戶才能與NetApp資料分類通訊。您必須在NetApp控制台租賃帳戶上擁有「組織管理員」角色才能建立服務帳戶。具有組織管理員角色的成員可以完成組織中的所有操作。"了解如何在NetApp控制台中為成員新增角色"
-
AI 引擎必須能夠存取"NetApp控制台 API 端點"。
-
您需要按照"NetApp資料分類文檔":
-
建立控制台代理
-
確保您的環境符合先決條件
-
部署NetApp資料分類
-
擷取 CSV , JSON , JSONP 或 Parquet 等結構化資料檔案時,不支援資料欄功能。 -
聊天和檢索設定
-
聊天模型:
-
從 Amazon Bedrock 整合的各種聊天模型中進行選擇。請注意,您必須已經啟用來自 Amazon Bedrock 的聊天模型。
-
如果適用,請選擇與所選模型的配置相符的推理類型。
-
-
聊天設定:
-
為聊天機器人選擇一個溫度來配置回應的隨機性和創造性。較低的溫度會導致更可預測的反應,而較高的溫度會導致更多樣化的反應。
-
選擇最大響應長度來配置響應的詳細程度。回應長度越長,使用的回應令牌就越多,並且會產生更高的成本。
-
-
思考模式:啟用思考模式後,聊天機器人將花費更多時間來處理查詢,結果通常會更準確。當您啟用思考模式時,您可以控制在產生結果時使用多少個推理標記。使用更多的推理標記可以獲得更準確的回應,但可能會產生更高的成本。
-
重新排名:啟用或停用重新排名,這可以提高查詢結果的相關性和品質。選擇標準聊天模型或專門的重新排名模型用於重新排名。僅當您所在地區可用時才會顯示 Reranker 模型選項。選擇與所選模型的配置相符的推理類型。
-
* 對話開場白 * :選擇是否要提供最多四個對話啟動器提示、讓與使用此知識庫的聊天機器人程式互動的使用者看到。建議您啟用此設定。
如果您啟動交談啟動器、預設會選取「自動模式」。只有在您將資料來源新增至知識庫之後、才能啟用「手動模式」。"瞭解如何修改知識庫設定"。
儲存定義
-
FSx for ONTAP檔案系統:當您定義新的知識庫時,Workload Factory 會建立一個新的Amazon FSx for NetApp ONTAP磁碟區來儲存它。選擇將在其中建立新磁碟區的現有檔案系統名稱和 SVM(也稱為儲存 VM)。
-
快照策略:從 Workload Factory 儲存清單中定義的現有策略清單中選擇快照策略。知識庫的定期快照將根據您選擇的快照策略以一定頻率自動建立。
-
S3 儲存桶:如果聊天機器人查詢結果包含結構化數據,GenAI 可以將結果儲存在 S3 儲存桶中。若要使用此功能,請啟用*啟動 S3 儲存桶*設定並從清單中選擇與您的帳戶關聯的 S3 儲存桶。當這些結果儲存在 S3 儲存桶中時,您可以使用聊天會話中的下載連結下載它們。
如果您需要的快照原則不存在、您可以 "建立快照原則"在包含該 Volume 的儲存 VM 上執行。
-
選取 * 建立知識庫 * 、將知識庫新增至 GenAI 。
建立知識庫時會出現進度指標。
建立知識庫之後、您可以選擇將資料來源新增至新的知識庫、或在不新增資料來源的情況下結束程序。建議您選擇 * 新增資料來源 * 、然後立即新增一或多個資料來源。
將資料來源新增至知識庫
您可以新增一或多個資料來源、以便將組織的資料填入知識庫。
支援的資料來源數量上限為 10 個。
-
選擇*新增資料來源*後,選擇要新增的資料來源類型:
-
新增 FSx for ONTAP 檔案系統(使用現有 FSx for ONTAP 磁碟區中的檔案)
-
新增檔案系統(使用來自通用 SMB 或 NFS 共享的檔案)
-
-
* 選取檔案系統 * :選取資料來源檔案所在的 ONTAP 檔案系統的 FSX ,然後選取 * 下一步 * 。
-
* 選取磁碟區 * :選取資料來源檔案所在的磁碟區、然後選取 * 下一步 * 。
選取使用 SMB 傳輸協定儲存的檔案時、您需要輸入 Active Directory 資訊、其中包括網域、 IP 位址、使用者名稱和密碼。
-
* 選取資料來源 * :根據您儲存檔案的位置選取資料來源位置。這可以是整個磁碟區、或只是磁碟區中的特定資料夾或子資料夾、然後選取 * 下一步 * 。
-
* 組態 * :設定資料來源如何從檔案中擷取資訊,以及其包含在掃描中的檔案:
-
* 定義資料來源 * :在 * 區塊策略 * 區段中,定義當資料來源與知識庫整合時, GenAI 引擎如何將資料來源內容分割成區塊。您可以選擇下列其中一個策略:
-
* 多重句子區塊 * :將資料來源中的資訊組織成句子定義的區塊。您可以選擇每個區塊中包含多少句話(最多 100 句)。
-
* 重疊區塊 * :將資料來源中的資訊組織成字元定義區塊、以重疊鄰近區塊。您可以選擇每個區塊的字元大小、以及每個區塊與相鄰區塊重疊的量。您可以設定 50 到 3000 個字元之間的區塊大小、以及介於 1 到 99% 之間的重疊百分比。
選擇高重疊百分比可大幅增加儲存需求、只需稍微改善擷取準確度。
-
-
* 檔案篩選 * :設定掃描中包含哪些檔案:
-
在「 * 檔案類型支援 * 」區段中,選擇要包含所有類型的檔案,或選擇要包含在資料來源掃描中的個別檔案類型。
如果您包含圖像或 PDF 文件, NetApp Workload Factory for GenAI 會解析圖像中的文字(包括 PDF 文件中的圖像),這會產生更高的成本。
當包含影像的文字資料時,當掃描的文字資料從您的環境傳送至 AWS 時, GenAI 無法從影像中遮罩個人識別資訊( PII )。然而,一旦儲存資料, GenAI 資料庫就會隱藏所有 PII 。
-
您選擇在掃描中包含影像檔案,與知識庫聊天模式有關。如果您在掃描中包含影像檔案,則聊天模式必須支援影像。如果在此選取映像檔案類型,您就無法將知識庫切換至不支援映像檔案的聊天模式。 -
在 * 檔案修改時間篩選器 * 區段中,選擇根據檔案的修改時間來啟用或停用檔案的包含。如果啟用修改時間篩選,請從清單中選取日期範圍。
如果您根據修改日期範圍來包含檔案,只要日期範圍不滿足(檔案尚未在您指定的日期範圍內修改),檔案就會排除在定期掃描之外,而且資料來源也不會包含這些檔案。
-
-
在 * 權限感知 * 區段中,只有當您選取的資料來源位於使用 SMB 通訊協定的磁碟區上時,才能使用此區段,您可以啟用或停用權限感知回應:
-
* 已啟用 * :存取此知識庫的聊天機器人程式使用者只能從其存取的資料來源取得查詢回應。
-
* 停用 * :聊天機器人程式的使用者將會使用所有整合式資料來源的內容接收回應。
-
-
選取 * 新增 * 將此資料來源新增至您的知識庫。
-
選擇檔案系統:輸入資料來源檔案所在的檔案系統主機的 IP 位址或 FQDN,選擇網路共用的 NFS 協議,然後選擇*下一步*。
-
* 選取資料來源 * :根據您儲存檔案的位置選取資料來源位置。這可以是整個磁碟區、或只是磁碟區中的特定資料夾或子資料夾、然後選取 * 下一步 * 。
在某些情況下,您可能需要手動輸入 NFS 匯出名稱,然後選擇「擷取目錄」以顯示可用目錄。您可以選擇整個匯出,或僅選擇匯出中的特定資料夾。 -
* 組態 * :設定資料來源如何從檔案中擷取資訊,以及其包含在掃描中的檔案:
-
* 定義資料來源 * :在 * 區塊策略 * 區段中,定義當資料來源與知識庫整合時, GenAI 引擎如何將資料來源內容分割成區塊。您可以選擇下列其中一個策略:
-
* 多重句子區塊 * :將資料來源中的資訊組織成句子定義的區塊。您可以選擇每個區塊中包含多少句話(最多 100 句)。
-
* 重疊區塊 * :將資料來源中的資訊組織成字元定義區塊、以重疊鄰近區塊。您可以選擇每個區塊的字元大小、以及每個區塊與相鄰區塊重疊的量。您可以設定 50 到 3000 個字元之間的區塊大小、以及介於 1 到 99% 之間的重疊百分比。
選擇高重疊百分比可大幅增加儲存需求、只需稍微改善擷取準確度。
-
-
* 檔案篩選 * :設定掃描中包含哪些檔案:
-
在「 * 檔案類型支援 * 」區段中,選擇要包含所有類型的檔案,或選擇要包含在資料來源掃描中的個別檔案類型。
如果您包含圖像或 PDF 文件, NetApp Workload Factory for GenAI 會解析圖像中的文字(包括 PDF 文件中的圖像),這會產生更高的成本。
當包含影像的文字資料時,當掃描的文字資料從您的環境傳送至 AWS 時, GenAI 無法從影像中遮罩個人識別資訊( PII )。然而,一旦儲存資料, GenAI 資料庫就會隱藏所有 PII 。
-
您選擇在掃描中包含影像檔案,與知識庫聊天模式有關。如果您在掃描中包含影像檔案,則聊天模式必須支援影像。如果在此選取映像檔案類型,您就無法將知識庫切換至不支援映像檔案的聊天模式。 -
在 * 檔案修改時間篩選器 * 區段中,選擇根據檔案的修改時間來啟用或停用檔案的包含。如果啟用修改時間篩選,請從清單中選取日期範圍。
如果您根據修改日期範圍來包含檔案,只要日期範圍不滿足(檔案尚未在您指定的日期範圍內修改),檔案就會排除在定期掃描之外,而且資料來源也不會包含這些檔案。
-
-
選擇*新增資料來源*將此資料來源新增至您的知識庫。
-
選擇檔案系統:
-
輸入資料來源檔案所在的檔案系統主機的 IP 位址或 FQDN。
-
為網路共享選擇 SMB 協定。
-
輸入 Active Directory 訊息,包括網域、IP 位址、使用者名稱和密碼。
-
選擇*下一步*。
-
-
* 選取資料來源 * :根據您儲存檔案的位置選取資料來源位置。這可以是整個磁碟區、或只是磁碟區中的特定資料夾或子資料夾、然後選取 * 下一步 * 。
在某些情況下,您可能需要手動輸入 SMB 共享名稱,然後選擇「檢索目錄」以顯示可用目錄。您可以選擇整個共享,或僅選擇共享中的特定資料夾。 -
* 組態 * :設定資料來源如何從檔案中擷取資訊,以及其包含在掃描中的檔案:
-
* 定義資料來源 * :在 * 區塊策略 * 區段中,定義當資料來源與知識庫整合時, GenAI 引擎如何將資料來源內容分割成區塊。您可以選擇下列其中一個策略:
-
* 多重句子區塊 * :將資料來源中的資訊組織成句子定義的區塊。您可以選擇每個區塊中包含多少句話(最多 100 句)。
-
* 重疊區塊 * :將資料來源中的資訊組織成字元定義區塊、以重疊鄰近區塊。您可以選擇每個區塊的字元大小、以及每個區塊與相鄰區塊重疊的量。您可以設定 50 到 3000 個字元之間的區塊大小、以及介於 1 到 99% 之間的重疊百分比。
選擇高重疊百分比可大幅增加儲存需求、只需稍微改善擷取準確度。
-
-
權限感知:啟用或停用權限感知回應:
-
* 已啟用 * :存取此知識庫的聊天機器人程式使用者只能從其存取的資料來源取得查詢回應。
-
* 停用 * :聊天機器人程式的使用者將會使用所有整合式資料來源的內容接收回應。
-
-
* 檔案篩選 * :設定掃描中包含哪些檔案:
-
在「 * 檔案類型支援 * 」區段中,選擇要包含所有類型的檔案,或選擇要包含在資料來源掃描中的個別檔案類型。
如果您包含圖像或 PDF 文件, NetApp Workload Factory for GenAI 會解析圖像中的文字(包括 PDF 文件中的圖像),這會產生更高的成本。
當包含影像的文字資料時,當掃描的文字資料從您的環境傳送至 AWS 時, GenAI 無法從影像中遮罩個人識別資訊( PII )。然而,一旦儲存資料, GenAI 資料庫就會隱藏所有 PII 。
-
您選擇在掃描中包含影像檔案,與知識庫聊天模式有關。如果您在掃描中包含影像檔案,則聊天模式必須支援影像。如果在此選取映像檔案類型,您就無法將知識庫切換至不支援映像檔案的聊天模式。 -
在 * 檔案修改時間篩選器 * 區段中,選擇根據檔案的修改時間來啟用或停用檔案的包含。如果啟用修改時間篩選,請從清單中選取日期範圍。
如果您根據修改日期範圍來包含檔案,只要日期範圍不滿足(檔案尚未在您指定的日期範圍內修改),檔案就會排除在定期掃描之外,而且資料來源也不會包含這些檔案。
-
-
選擇*新增資料來源*將此資料來源新增至您的知識庫。
資料來源開始內嵌到您的知識庫中。資料來源完全內嵌時、狀態會從「內嵌」變更為「內嵌」。
將單一資料來源新增至知識庫之後、您可以在聊天機器人程式模擬器視窗中進行本機測試、並在將聊天機器人程式提供給使用者之前進行任何必要的變更。您也可以依照相同步驟、將其他資料來源新增至知識庫。