管理 Amazon Q Business 連接器
為 Amazon Q Business 建立連接器之後,您可以檢視連接器詳細資料,修改連接器,整合其他資料來源,或刪除連接器。
檢視連接器的相關資訊
您可以檢視連接器和整合資料來源的設定資訊。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
從工作負載原廠導覽功能表中,選取 * AI * 。
-
選取您要檢視的連接器。
-
若要檢視連接器詳細資料,請選取
並選取 * 管理連接器 * 。
此頁面會顯示發佈的狀態、資料來源的內嵌狀態、內嵌模式、所有內嵌資料來源的清單等等。
「 * 動作 * 」功能表可讓您在需要進行任何變更時,管理連接器。
編輯連接器
您可以變更某些設定來更新連接器,也可以新增或移除資料來源。
每當您從連接器新增,修改或移除資料來源時, GenAI 都需要將資料來源資訊傳送至 Amazon Q Business ,以便重新建立索引。同步是漸進式的,因此 Amazon Q Business 只會處理您的 FSX for ONTAP Volume 中自上次同步後已新增,修改或刪除的物件。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
從「知識庫與連接器」庫存頁面中,選取您要更新的連接器。
-
選取
並選取 * 管理連接器 * 。
此頁面會顯示發佈的狀態、資料來源的內嵌狀態、內嵌模式、所有內嵌資料來源的清單等等。
-
選取 * 動作 * 功能表,然後選取 * 編輯連接器 * 。
-
在「編輯連接器」頁面中,您可以變更連接器名稱,說明,內嵌模型,啟用資料欄,以及用於包含連接器之磁碟區的快照原則。
每次資料來源掃描(包括內嵌)都會產生成本。如果您在建立連接器之後啟用資料 guardrails ,則會再次掃描資料來源並產生成本。 -
變更後請選擇 * 儲存 * 。
新增其他資料來源至連接器
您可以在連接器中內嵌其他資料來源,以便將其他組織資料填入連接器中。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
從「知識庫與連接器」庫存頁面中,選取您要新增資料來源的連接器。
-
選取
並選取 * 新增資料來源 * 。
-
選擇要新增的資料來源類型:
-
新增 FSx for ONTAP 檔案系統(使用現有 FSx for ONTAP 磁碟區中的檔案)
-
新增檔案系統(使用來自通用 SMB 或 NFS 共享的檔案)
-
-
* 選取檔案系統 * :選取資料來源檔案所在的 ONTAP 檔案系統的 FSX ,然後選取 * 下一步 * 。
-
* 選取磁碟區 * :選取資料來源檔案所在的磁碟區、然後選取 * 下一步 * 。
選取使用 SMB 傳輸協定儲存的檔案時、您需要輸入 Active Directory 資訊、其中包括網域、 IP 位址、使用者名稱和密碼。
-
* 選取資料來源 * :根據您儲存檔案的位置選取資料來源位置。這可以是整個磁碟區、或只是磁碟區中的特定資料夾或子資料夾、然後選取 * 下一步 * 。
-
* 組態 * :設定資料來源如何從檔案中擷取資訊,以及其包含在掃描中的檔案:
-
* 定義資料來源 * :在 * 區塊策略 * 區段中,定義當資料來源與知識庫整合時, GenAI 引擎如何將資料來源內容分割成區塊。您可以選擇下列其中一個策略:
-
* 多重句子區塊 * :將資料來源中的資訊組織成句子定義的區塊。您可以選擇每個區塊中包含多少句話(最多 100 句)。
-
* 重疊區塊 * :將資料來源中的資訊組織成字元定義區塊、以重疊鄰近區塊。您可以選擇每個區塊的字元大小、以及每個區塊與相鄰區塊重疊的量。您可以設定 50 到 3000 個字元之間的區塊大小、以及介於 1 到 99% 之間的重疊百分比。
選擇高重疊百分比可大幅增加儲存需求、只需稍微改善擷取準確度。
-
-
* 檔案篩選 * :設定掃描中包含哪些檔案:
-
在「 * 檔案類型支援 * 」區段中,選擇要包含所有類型的檔案,或選擇要包含在資料來源掃描中的個別檔案類型。
如果您包含影像或 PDF 檔案,則 GenAI 的 BlueXP 工作負載工廠會剖析影像中的文字(包括 PDF 文件中的影像),這會產生較高的成本。
當包含影像的文字資料時,當掃描的文字資料從您的環境傳送至 AWS 時, GenAI 無法從影像中遮罩個人識別資訊( PII )。然而,一旦儲存資料, GenAI 資料庫就會隱藏所有 PII 。
-
您選擇在掃描中包含影像檔案,與知識庫聊天模式有關。如果您在掃描中包含影像檔案,則聊天模式必須支援影像。如果在此選取映像檔案類型,您就無法將知識庫切換至不支援映像檔案的聊天模式。 -
在 * 檔案修改時間篩選器 * 區段中,選擇根據檔案的修改時間來啟用或停用檔案的包含。如果啟用修改時間篩選,請從清單中選取日期範圍。
如果您根據修改日期範圍來包含檔案,只要日期範圍不滿足(檔案尚未在您指定的日期範圍內修改),檔案就會排除在定期掃描之外,而且資料來源也不會包含這些檔案。
-
-
在 * 權限感知 * 區段中,只有當您選取的資料來源位於使用 SMB 通訊協定的磁碟區上時,才能使用此區段,您可以啟用或停用權限感知回應:
-
* 已啟用 * :存取此知識庫的聊天機器人程式使用者只能從其存取的資料來源取得查詢回應。
-
* 停用 * :聊天機器人程式的使用者將會使用所有整合式資料來源的內容接收回應。
-
-
選取 * 新增 * 將此資料來源新增至您的知識庫。
-
選擇檔案系統:輸入資料來源檔案所在的檔案系統主機的 IP 位址或 FQDN,選擇網路共用的 NFS 協議,然後選擇*下一步*。
-
* 選取資料來源 * :根據您儲存檔案的位置選取資料來源位置。這可以是整個磁碟區、或只是磁碟區中的特定資料夾或子資料夾、然後選取 * 下一步 * 。
在某些情況下,您可能需要手動輸入 NFS 匯出名稱,然後選擇「擷取目錄」以顯示可用目錄。您可以選擇整個匯出,或僅選擇匯出中的特定資料夾。 -
* 組態 * :設定資料來源如何從檔案中擷取資訊,以及其包含在掃描中的檔案:
-
* 定義資料來源 * :在 * 區塊策略 * 區段中,定義當資料來源與知識庫整合時, GenAI 引擎如何將資料來源內容分割成區塊。您可以選擇下列其中一個策略:
-
* 多重句子區塊 * :將資料來源中的資訊組織成句子定義的區塊。您可以選擇每個區塊中包含多少句話(最多 100 句)。
-
* 重疊區塊 * :將資料來源中的資訊組織成字元定義區塊、以重疊鄰近區塊。您可以選擇每個區塊的字元大小、以及每個區塊與相鄰區塊重疊的量。您可以設定 50 到 3000 個字元之間的區塊大小、以及介於 1 到 99% 之間的重疊百分比。
選擇高重疊百分比可大幅增加儲存需求、只需稍微改善擷取準確度。
-
-
* 檔案篩選 * :設定掃描中包含哪些檔案:
-
在「 * 檔案類型支援 * 」區段中,選擇要包含所有類型的檔案,或選擇要包含在資料來源掃描中的個別檔案類型。
如果您包含影像或 PDF 檔案,則 GenAI 的 BlueXP 工作負載工廠會剖析影像中的文字(包括 PDF 文件中的影像),這會產生較高的成本。
當包含影像的文字資料時,當掃描的文字資料從您的環境傳送至 AWS 時, GenAI 無法從影像中遮罩個人識別資訊( PII )。然而,一旦儲存資料, GenAI 資料庫就會隱藏所有 PII 。
-
您選擇在掃描中包含影像檔案,與知識庫聊天模式有關。如果您在掃描中包含影像檔案,則聊天模式必須支援影像。如果在此選取映像檔案類型,您就無法將知識庫切換至不支援映像檔案的聊天模式。 -
在 * 檔案修改時間篩選器 * 區段中,選擇根據檔案的修改時間來啟用或停用檔案的包含。如果啟用修改時間篩選,請從清單中選取日期範圍。
如果您根據修改日期範圍來包含檔案,只要日期範圍不滿足(檔案尚未在您指定的日期範圍內修改),檔案就會排除在定期掃描之外,而且資料來源也不會包含這些檔案。
-
-
選擇*新增資料來源*將此資料來源新增至您的知識庫。
-
選擇檔案系統:
-
輸入資料來源檔案所在的檔案系統主機的 IP 位址或 FQDN。
-
為網路共享選擇 SMB 協定。
-
輸入 Active Directory 訊息,包括網域、IP 位址、使用者名稱和密碼。
-
選擇*下一步*。
-
-
* 選取資料來源 * :根據您儲存檔案的位置選取資料來源位置。這可以是整個磁碟區、或只是磁碟區中的特定資料夾或子資料夾、然後選取 * 下一步 * 。
在某些情況下,您可能需要手動輸入 SMB 共享名稱,然後選擇「檢索目錄」以顯示可用目錄。您可以選擇整個共享,或僅選擇共享中的特定資料夾。 -
* 組態 * :設定資料來源如何從檔案中擷取資訊,以及其包含在掃描中的檔案:
-
* 定義資料來源 * :在 * 區塊策略 * 區段中,定義當資料來源與知識庫整合時, GenAI 引擎如何將資料來源內容分割成區塊。您可以選擇下列其中一個策略:
-
* 多重句子區塊 * :將資料來源中的資訊組織成句子定義的區塊。您可以選擇每個區塊中包含多少句話(最多 100 句)。
-
* 重疊區塊 * :將資料來源中的資訊組織成字元定義區塊、以重疊鄰近區塊。您可以選擇每個區塊的字元大小、以及每個區塊與相鄰區塊重疊的量。您可以設定 50 到 3000 個字元之間的區塊大小、以及介於 1 到 99% 之間的重疊百分比。
選擇高重疊百分比可大幅增加儲存需求、只需稍微改善擷取準確度。
-
-
權限感知:啟用或停用權限感知回應:
-
* 已啟用 * :存取此知識庫的聊天機器人程式使用者只能從其存取的資料來源取得查詢回應。
-
* 停用 * :聊天機器人程式的使用者將會使用所有整合式資料來源的內容接收回應。
-
-
* 檔案篩選 * :設定掃描中包含哪些檔案:
-
在「 * 檔案類型支援 * 」區段中,選擇要包含所有類型的檔案,或選擇要包含在資料來源掃描中的個別檔案類型。
如果您包含影像或 PDF 檔案,則 GenAI 的 BlueXP 工作負載工廠會剖析影像中的文字(包括 PDF 文件中的影像),這會產生較高的成本。
當包含影像的文字資料時,當掃描的文字資料從您的環境傳送至 AWS 時, GenAI 無法從影像中遮罩個人識別資訊( PII )。然而,一旦儲存資料, GenAI 資料庫就會隱藏所有 PII 。
-
您選擇在掃描中包含影像檔案,與知識庫聊天模式有關。如果您在掃描中包含影像檔案,則聊天模式必須支援影像。如果在此選取映像檔案類型,您就無法將知識庫切換至不支援映像檔案的聊天模式。 -
在 * 檔案修改時間篩選器 * 區段中,選擇根據檔案的修改時間來啟用或停用檔案的包含。如果啟用修改時間篩選,請從清單中選取日期範圍。
如果您根據修改日期範圍來包含檔案,只要日期範圍不滿足(檔案尚未在您指定的日期範圍內修改),檔案就會排除在定期掃描之外,而且資料來源也不會包含這些檔案。
-
-
選擇*新增資料來源*將此資料來源新增至您的知識庫。
資料來源已整合至您的連接器。
將資料來源與連接器同步
資料來源會每天自動與相關的連接器同步一次,以便在 Amazon Q Business 中反映任何資料來源變更。如果您變更任何資料來源,而且想要立即同步(掃描)資料,您可以執行隨需同步。
同步是漸進式的,因此 Amazon Q Business 只會處理資料來源中自上次同步以來已新增,修改或刪除的物件。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
從「知識庫與連接器」標籤中,選取您要同步的連接器。
-
選取
並選取 * 管理連接器 * 。
-
選取 * 動作 * 功能表、然後選取 * 立即掃描 * 。
您會看到一則訊息、指出正在掃描資料來源、以及掃描完成後的最後一則訊息。
連接器會與附加的資料來源同步, Amazon Q Business 會開始使用您資料來源的最新資訊。
暫停或繼續排程的同步處理
如果您想要暫停或恢復資料來源的下一次同步(掃描),您可以隨時進行。如果您要變更資料來源,而不想在變更期間進行同步處理,則可能需要暫停下一次排程的同步處理。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
從連接器庫存頁面中,選取您要暫停或恢復掃描的連接器。
-
選取
並選取 * 管理連接器 * 。
-
選取 * 動作 * 功能表,然後選取 * 掃描 > 暫停排程掃描 * 或 * 掃描 > 恢復排程掃描 * 。
您會看到訊息,表示下一次排程掃描已暫停或恢復。
刪除連接器
如果您不再需要連接器,可以將其刪除。刪除連接器時,它會從工作負載工廠移除,並刪除包含連接器的磁碟區。刪除連接器是不可還原的。
刪除連接器時,您也應該解除連接器與任何與其相關的代理程式的關聯,以便完全刪除與連接器相關的所有資源。
-
使用其中一項登入工作負載工廠"主控台體驗"。
-
從「知識庫與連接器」庫存頁面中,選取您要刪除的連接器。
-
選取
並選取 * 管理連接器 * 。
-
選取 * 動作 * 功能表,然後選取 * 刪除連接器 * 。
-
在刪除連接器對話方塊中,確認您要刪除它,然後選取 * 刪除 * 。
連接器會從工作負載工廠移除,並刪除其相關的磁碟區。