为 Amazon Q Business 创建 NetApp 连接器
部署 AI 基础架构并确定将从 FSx for ONTAP 数据存储区使用的数据源后,您就可以为 Amazon Q Business 定义 NetApp 连接器了。
在继续操作之前、请确保您的环境符合"要求"Amazon Q Business的要求。
您组织的数据源可能包含个人身份信息 (PII)。为了保护这些敏感信息,您可以在定义连接器时启用_数据护栏_。由NetApp数据分类提供支持的数据护栏可识别和屏蔽 PII,使其无法访问和恢复。
|
|
NetApp Workload Factory for GenAI 不会屏蔽敏感个人信息 (SPII)。参考"敏感个人数据的类型"有关此类数据的更多信息。 |
|
|
数据护栏可以随时启用或禁用。如果您切换数据护栏启用,Workload Factory 将从头开始扫描整个数据源,这可能会产生成本。 |
定义接头
为 Amazon Q Business 创建 NetApp 连接器。该连接器支持 GenAI 和 Amazon Q Business 之间的 API 和数据源通信。
-
使用以下方式之一登录 Workload Factory"控制台体验" 。
-
在AI Workloads (AI工作负载)磁贴中、选择*部署和管理*。
-
从知识库和连接器菜单中,选择*新建*下拉菜单并选择*Amazon Q 商业连接器*。
-
在"定义连接器"页面上、配置连接器设置:
-
Name:输入要用于连接器的名称。
-
Description:输入连接器的详细说明。
-
Amazon Q:要集成的Amazon Q Business实例的区域和应用程序名称。
-
数据护栏:选择是否要启用或禁用数据护栏。"了解由NetApp数据分类提供支持的数据护栏" 。
要启用数据防护、必须满足以下前提条件。
-
需要服务帐户才能与NetApp数据分类进行通信。您必须在NetApp控制台租赁帐户上拥有“组织管理员”角色才能创建服务帐户。具有组织管理员角色的成员可以在NetApp控制台中完成所有操作。"了解如何在NetApp控制台中为成员添加角色"
-
AI 引擎必须能够访问"NetApp控制台 API 端点"。
-
您需要按照"NetApp数据分类文档":
-
创建控制台代理
-
确保您的环境满足前提条件
-
部署NetApp数据分类
-
启用数据保障功能后、GenAI将通过仅输入纯文本(不包括嵌入的图像或媒体文本)并屏蔽任何私有或敏感数据来处理.txt、.MD、.csv、.DOCX和.pdf文件。所有其他文件类型均正常处理、不会屏蔽私有或敏感数据。 -
-
FSx for ONTAP文件系统:当您为 Amazon Q Business 定义新的NetApp Connector 时,Workload Factory 会创建一个新的Amazon FSx for NetApp ONTAP卷来存储连接器信息。选择将在其中创建新卷的现有文件系统和 SVM(也称为存储 VM)。
-
快照策略:从 Workload Factory 存储清单中定义的现有策略列表中选择一个快照策略。 GenAI 会根据您选择的快照策略以一定频率自动创建存储连接器信息的卷的定期快照。
如果不存在所需的快照策略、则可以 "创建快照策略"在包含此卷的Storage VM上执行此操作。
-
-
选择*创建连接器*以将Amazon Q Business与GenAI集成。
创建连接器时、将显示进度指示器。
创建连接器后、您可以选择向连接器添加数据源、以便Amazon Q Business可以先插入数据、然后将其添加到索引中。建议您选择*添加数据源*,然后立即添加一个或多个数据源。
将数据源添加到连接器
您可以添加一个或多个数据源、以便使用您组织的数据填充Amazon Q Business索引。
-
支持的最大数据源数为10。
-
有关亚马逊Q业务索引的特定服务限制、请参阅 "Amazon Q Business文档"。
-
选择*添加数据源*后,将出现*选择文件系统*页面。
-
选择文件系统:选择数据源文件所在的FSx for ONTAP文件系统,然后选择*下一步*。
-
选择卷:选择数据源文件所在的卷,然后选择*下一步*。
选择使用SMB协议存储的文件时、您需要输入Active Directory信息、其中包括域、IP地址、用户名和密码。
-
选择数据源:根据文件的保存位置选择数据源位置。该卷可以是整个卷,也可以是卷中的特定文件夹或子文件夹,然后选择*Next*。
-
配置:配置数据源如何从文件中获取信息,以及它包含在扫描中的文件:
-
文件过滤:配置扫描中包含的文件:
-
在*文件类型支持*部分,选择包括所有类型的文件,或选择要包含在数据源扫描中的单个文件类型。
-
在*文件修改时间过滤器*部分,选择根据修改时间启用或禁用包含文件。如果启用了修改时间筛选、请从列表中选择一个日期范围。
如果您包含基于修改日期范围的文件、则只要不满足日期范围(这些文件在您指定的日期范围内未被修改)、这些文件就会从定期扫描中排除、并且数据源不会包含这些文件。
-
-
-
在*权限感知*部分(仅当您选择的数据源位于使用SMB协议的卷上时才可用)中、您可以启用或禁用权限感知响应:
-
已启用:访问此连接器的聊天机器人用户将仅获得其有权访问的数据源的查询响应。
-
已禁用:聊天机器人用户将使用所有集成数据源的内容接收响应。
Amazon Q Business Connector数据源不支持Active Directory组权限。
-
-
选择*添加*以将此数据源添加到Amazon Q Business连接器。
数据源嵌入到Amazon Q Business索引中。当数据源完全嵌入时、状态将从"嵌入"更改为"嵌入"。
向连接器添加单个数据源后、您可以在Amazon Q Business聊天机器人环境中对其进行测试、并进行任何必要的更改、然后再向用户提供服务。您也可以按照相同的步骤向连接器添加其他数据源。