Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

GenAI故障排除

贡献者

了解如何解决您可能遇到的一些常见问题。

常见问题和解决方案

如果您遇到上述问题之一、可以使用"解决方法"列中的步骤尝试解决该问题。

区域 问题描述 发生原因 临时解决策

部署

由于卷已存在、部署失败。

在部署过程中、适用于GenAI的BlueXP  工作负载工厂需要创建一个新卷、但使用您指定的名称的卷已存在。

指定要用于新卷的唯一名称、然后重新尝试部署。

部署

由于适用于GenAI的BlueXP  工作负载工厂无法挂载此卷、部署失败。

FSx for NetApp ONTAP所需的一个或多个入站端口已关闭或筛选。

打开以下入站端口:

| 协议 | 端口 | 目的

| 所有 ICMP | 全部 | Ping 实例

| HTTPS | 443 | 从Connector访问fsxadmin管理LIF、以便向FSX发送API调用

| SSH | 22 | SSH 访问集群管理 LIF 或节点管理 LIF 的 IP 地址

| TCP | 111 | 远程过程调用 NFS

| TCP | 139 | 用于 CIFS 的 NetBIOS 服务会话

| TCP | 161-162 | 简单网络管理协议

| TCP | 445 | Microsoft SMB/CIFS over TCP (通过 TCP )和 NetBIOS 成帧

| TCP | 635 | NFS 挂载

| TCP | 749 | Kerberos

| TCP | 2049 | NFS 服务器守护进程

| TCP | 3260 | 通过 iSCSI 数据 LIF 进行 iSCSI 访问

| TCP | 4045 | NFS 锁定守护进程

| TCP | 4046 | NFS 的网络状态监视器

| TCP | 10000 | 使用 NDMP 备份

| TCP | 11104 | 管理 SnapMirror 的集群间通信会话

| TCP | 11105 | 使用集群间 LIF 进行 SnapMirror 数据传输

| UDP | 111 | 远程过程调用 NFS

| UDP | 161-162 | 简单网络管理协议

| UDP | 635 | NFS 挂载

| UDP | 2049 | NFS 服务器守护进程

| UDP | 4045 | NFS 锁定守护进程

| UDP | 4046 | NFS 的网络状态监视器

| UDP | 4049 | NFS Rquotad 协议

维护

AI引擎启动失败,您在*Knowledge Bases*页面上看到错误"AI引擎实例错误"。

AI引擎实例已损坏或不存在。

选择*重建*按钮。适用于GenAI的BlueXP  工作负载工厂会重建基础架构并显示重建进度。完成后、您的知识库将重新连接到重建的基础架构、并显示知识库列表。

维护

AI引擎启动失败,您在*Knowledge Bases*页面上看到错误"The GenAI Engine Instance is Stop"(GenAI引擎实例已停止)。

AI引擎实例未运行。

使用AWS管理控制台或AWS命令行界面启动AI引擎实例。

维护

AI引擎启动失败,您在*Knowledge Bases*页面上看到错误"The GenAI引擎server is not starting"(GenAI引擎服务器未响应)。

AI引擎实例未响应。

请使用以下恢复步骤:

步骤
  1. 修改GenAI引擎实例安全组、以启用对GenAI引擎实例的SSH访问。

  2. 使用SSH登录到实例。

  3. 运行以下命令:

    docker-compose up

维护

BlueXP  工作负载工厂使用的后端Docker实例无法启动GenAI。

已删除此卷并重新启动EC2实例。

请使用以下恢复步骤:

步骤
  1. 在FSx for NetApp ONTAP上创建新卷。例如,卷名可以是 netapp_ai,卷路径可以是 /netapp_ai

  2. 通过SSH连接到Amazon EC2实例。

  3. 列出卷:

    docker volume list
  4. 删除旧卷:

    docker volume rm ec2-user_persistent_folder
  5. `docker-compose.yml`使用文本编辑器打开文件。

  6. 在 `volumes`部分中、将设备路径更改为新卷路径。例如:

    volumes:
      persistent_folder:
        driver_opts:
          type: 'nfs'
          o: "addr=svm-0df66b96a890d8a72.\
          fs-0d673008aaca12bc3.\
          fsx.us-east-1.amazonaws.com,nolock,soft,rw"
          device: ':/netapp_ai' # Path to new volume

维护

BlueXP  工作负载工厂使用的后端Docker实例无法启动GenAI。

已删除此根卷。

使用名称和路径创建一个卷、然后从Amazon EC2重新启动后端Docker实例。

维护

BlueXP  工作负载工厂使用的后端Docker实例无法启动GenAI。

已删除此根卷。

使用名称和路径创建一个卷、然后从Amazon EC2重新启动后端Docker实例。