GenAI知识库要求
在构建知识库之前、请确保已正确设置工作负载工厂和AWS。其中包括拥有AWS登录凭据、部署了一个FSx for ONTAP文件系统(其中包含您要集成到知识库中的数据源)、访问Amazon B基石AI服务等。
基本GenAI要求
GenAI具有您的环境在开始使用之前需要满足的一般要求。
- 工作负载出厂登录和帐户
-
您需要 "在Workload Factory中设置一个帐户"使用其中一个登录 "控制台体验"。
- AWS 凭据和权限
-
您需要将 AWS 凭证添加到具有读/写权限的工作负载工厂,这意味着您将在 GenAI 的读/写模式下使用工作负载工厂。
目前不支持_Basic_模式和_read-only _模式权限。
设置凭据时、选择如下所示的权限后、您将拥有管理FSx for ONTAP文件系统以及部署和管理GenAI EC2实例以及知识库和聊天机器人所需的其他AWS资源的完全访问权限。
GenAI知识库要求
如果您计划使用知识库、请确保您的环境满足以下要求。
- 亚马逊基岩
-
Amazon Brock使您能够使用基础模型、并提供构建生成性AI应用程序的功能。
在开始使用适用于GenAI的BlueXP 工作负载工厂之前、您必须先设置Amazon Brock。您的GenAI部署必须位于启用了Amazon Brock的AWS地区。
默认情况下、GenAI会重新排列搜索结果、以提高结果相关性。为了获得最佳结果、请确保您的Amazon基岩基础模型配置包含对重新排序模型的访问权限、例如Cohere Rerank或Amazon Rerank (如果您所在地区有)。
- 嵌入模型
-
在创建知识库之前、您必须启用计划使用的嵌入模型。支持以下嵌入模型:
-
T人 嵌入G1 -文本
-
T人 嵌入文本v2
-
第1代多模态嵌入
-
嵌入英语
-
嵌入多语言
-
- 聊天模式
-
在创建知识库之前、您必须启用计划使用的基本聊天模式。由于型号支持因AWS地区而异、请参见 "AWS文档" 以验证您可以在计划部署知识库的地区使用哪些型号。
GenAI支持各种型号、包括Anthropic、Amazon、Mistral AI、Meta、JAMBA和cothere。
详细了解如何在Amazon Brock中使用这些模型:
- FSx for ONTAP文件系统
-
对于ONTAP文件系统、至少需要一个FSx:
-
NetApp GenAI引擎将使用一个文件系统(如果不存在、则创建一个文件系统)来存储知识库使用的矢量数据库。
此FSx for ONTAP文件系统必须使用FlexVol卷。不支持 FlexGroup 卷。
-
一个或多个文件系统将包含要集成到知识库中的数据源。
一个FSx for ONTAP文件系统可同时用于这两种用途、也可以使用多个FSx for ONTAP文件系统。
-
您需要了解AWS FSx for ONTAP文件系统所在的AWS区域、VPC和子网。文件系统必须位于已启用Amazon Brock的AWS区域中。
-
您需要考虑要应用于此部署中的AWS资源的标记键/值对(可选)。
-
您需要知道密钥对信息、以便安全地连接到NetApp AI引擎实例。
-