GenAI故障排除
了解如何解决您可能遇到的一些常见问题。
常见问题和解决方案
如果您遇到上述问题之一、可以使用"解决方法"列中的步骤尝试解决该问题。
区域 | 问题描述 | 发生原因 | 临时解决策 |
---|---|---|---|
部署 |
由于卷已存在、部署失败。 |
在部署过程中、适用于GenAI的BlueXP 工作负载工厂需要创建一个新卷、但使用您指定的名称的卷已存在。 |
指定要用于新卷的唯一名称、然后重新尝试部署。 |
部署 |
由于适用于GenAI的BlueXP 工作负载工厂无法挂载此卷、部署失败。 |
FSx for NetApp ONTAP所需的一个或多个入站端口已关闭或筛选。 |
打开以下入站端口: |
| 协议 | 端口 | 目的
| 所有 ICMP | 全部 | Ping 实例
| HTTPS | 443 | 从Connector访问fsxadmin管理LIF、以便向FSX发送API调用
| SSH | 22 | SSH 访问集群管理 LIF 或节点管理 LIF 的 IP 地址
| TCP | 111 | 远程过程调用 NFS
| TCP | 139 | 用于 CIFS 的 NetBIOS 服务会话
| TCP | 161-162 | 简单网络管理协议
| TCP | 445 | Microsoft SMB/CIFS over TCP (通过 TCP )和 NetBIOS 成帧
| TCP | 635 | NFS 挂载
| TCP | 749 | Kerberos
| TCP | 2049 | NFS 服务器守护进程
| TCP | 3260 | 通过 iSCSI 数据 LIF 进行 iSCSI 访问
| TCP | 4045 | NFS 锁定守护进程
| TCP | 4046 | NFS 的网络状态监视器
| TCP | 10000 | 使用 NDMP 备份
| TCP | 11104 | 管理 SnapMirror 的集群间通信会话
| TCP | 11105 | 使用集群间 LIF 进行 SnapMirror 数据传输
| UDP | 111 | 远程过程调用 NFS
| UDP | 161-162 | 简单网络管理协议
| UDP | 635 | NFS 挂载
| UDP | 2049 | NFS 服务器守护进程
| UDP | 4045 | NFS 锁定守护进程
| UDP | 4046 | NFS 的网络状态监视器
| UDP | 4049 | NFS Rquotad 协议
维护 |
AI引擎启动失败,您在*Knowledge Bases*页面上看到错误"AI引擎实例错误"。 |
AI引擎实例已损坏或不存在。 |
选择*重建*按钮。适用于GenAI的BlueXP 工作负载工厂会重建基础架构并显示重建进度。完成后、您的知识库将重新连接到重建的基础架构、并显示知识库列表。 |
维护 |
AI引擎启动失败,您在*Knowledge Bases*页面上看到错误"The GenAI Engine Instance is Stop"(GenAI引擎实例已停止)。 |
AI引擎实例未运行。 |
使用AWS管理控制台或AWS命令行界面启动AI引擎实例。 |
维护 |
AI引擎启动失败,您在*Knowledge Bases*页面上看到错误"The GenAI引擎server is not starting"(GenAI引擎服务器未响应)。 |
AI引擎实例未响应。 |
请使用以下恢复步骤: 步骤
|
维护 |
BlueXP 工作负载工厂使用的后端Docker实例无法启动GenAI。 |
已删除此卷并重新启动EC2实例。 |
请使用以下恢复步骤: 步骤
|
维护 |
BlueXP 工作负载工厂使用的后端Docker实例无法启动GenAI。 |
已删除此根卷。 |
使用名称和路径创建一个卷、然后从Amazon EC2重新启动后端Docker实例。 |
维护 |
BlueXP 工作负载工厂使用的后端Docker实例无法启动GenAI。 |
已删除此根卷。 |
使用名称和路径创建一个卷、然后从Amazon EC2重新启动后端Docker实例。 |