排查部署错误
如果您遇到部署问题,请查看日志和错误代码以诊断和解决问题。从适用于ONTAP tools for VMware vSphere开始,从 pod 收集的日志包包括来自 MongoDB、RabbitMQ 和 Vault 的日志,以及所有 pod 的状态和描述。这些是在现有ONTAP工具服务日志的基础上提供的,增强了可支持性和故障排除能力。
收集日志文件
您可以使用适用于VMware vSphere的ONTAP工具管理器用户界面中的选项收集ONTAP工具的日志文件。技术支持可能会要求您收集日志文件以帮助解决问题。
|
从ONTAP工具管理器生成日志会包含所有vCenter Server实例的所有日志。从vCenter Client用户界面生成日志的范围仅适用于选定vCenter Server。 |
-
从Web浏览器启动ONTAP工具管理器:
https://<ONTAPtoolsIP>:8443/virtualization/ui/
-
使用您在部署期间提供的适用于VMware vSphere的ONTAP工具管理员凭据登录。
-
从边栏中选择*Log Bundes*。
此操作可能需要几分钟时间。
-
选择*生成*以生成日志文件。
-
输入日志分发包的标签,然后选择*Gener成*。
下载tar.gz文件并将其发送给技术支持。
按照以下步骤使用vCenter Client用户界面生成日志包:
-
登录到vSphere Client。
-
在vSphere Client主页中、转到*支持*>*日志捆绑包*>*生成*。
-
提供日志包标签并生成日志包。文件生成后,您可以看到下载选项。下载可能需要一些时间。
|
生成的日志包将替换过去3天或72小时内生成的日志包。 |
部署错误代码
在适用于VMware vSphere的ONTAP工具部署、重新启动和恢复操作期间、您可能会遇到错误代码。 错误代码的长度为五位数、其中前两位数表示遇到问题描述的脚本、后三位数表示该脚本中的特定工作流。
所有错误日志都记录在 /var/log 目录下的 ansible-perl-errors.log 文件中,以便于轻松跟踪和解决问题。该日志文件包含错误代码和失败的 Ansible 任务。
|
此页面上提供的错误代码仅供参考。如果错误仍然存在或未提及解决方法、请联系支持团队。 |
下表列出了错误代码和相应的文件名。
错误代码 |
脚本名称 |
00 |
firstboot-network-config.pl、模式Deploy |
01. |
firstboot-network-config.pl、模式升级 |
02. |
firstboot-inputs-validation.pl |
03 |
firstboot-deploy-otv-ng.pl、Deploy、HA |
04. |
firstboot-deploy-otv-ng.pl、Deploy、非HA |
05. |
firstboot-deploy-otv-ng.pl、重新启动 |
06 |
firstboot-deploy-otv-ng.pl、升级、HA |
07 |
firstboot-deploy-otv-ng.pl、升级、非HA |
08 |
firstboot-otv-recovery.pl |
09 |
post-deploy-upgrade.pl |
错误代码的后三位数字表示脚本中的特定工作流错误:
部署错误代码 |
* 工作流 * |
分辨率 |
049 |
对于网络和验证、perl脚本不久也会分配这些权限 |
- |
050 |
SSH密钥生成失败 |
重新启动主虚拟机(VM)。 |
053 |
安装RKE2失败 |
运行以下命令并重新启动主VM或重新部署: sudo rke2-killall.sh (所有VM) sudo rke2-uninstall.sh (所有VM)。 |
054 |
设置kubeconfig |
重新部署 |
055 |
部署注册表失败 |
如果存在注册表POD、请等待POD准备就绪、然后重新启动主VM或重新部署。 |
059 |
KubeVip部署失败 |
确保在部署期间提供的Kubbernetes控制平台的虚拟IP地址和ONTAP工具IP地址属于同一个VLAN且为空闲IP地址。如果先前所有点都正确、请重新启动。否则、重新部署。 |
060 |
操作员部署失败 |
重新启动 |
061 |
服务部署失败 |
在NTV-system命名空间中执行基本Kubirnetes调试、例如GET Pod、GET RS、GET Svc等、有关详细信息和错误日志、请访问/var/log/ansible-perl-errors.log和/var/log/ansible-run.log并重新部署。 |
062 |
ONTAP工具服务部署失败 |
有关详细信息、请参见/var/log/ansible-perl-errors.log上的错误日志并重新部署。 |
065 |
无法访问Swagger页面URL |
重新部署 |
066 |
网关证书的部署后步骤失败 |
执行以下操作以恢复/完成升级:*启用诊断shell。*运行"sudo perl /home / maint/scripts/post-deploy-upgrade.pl --postDeploy "命令。*请查看/var/log/post-depe-upgrade.log中的日志。 |
088 |
为jourald配置日志轮换失败 |
检查与托管VM的主机兼容的VM网络设置。您可以尝试迁移到其他主机并重新启动虚拟机。 |
089 |
更改摘要日志轮换配置文件的所有权失败 |
重新启动主VM。 |
096 |
安装动态存储配置程序 |
- |
108 |
传播脚本失败 |
- |
重新启动错误代码 |
* 工作流 * |
分辨率 |
067 |
正在等待rke2-server超时。 |
- |
101. |
无法重置维护/控制台用户密码。 |
- |
102. |
无法在重置维护/控制台用户密码期间删除密码文件。 |
- |
103. |
无法在库中更新新的维护/控制台用户密码。 |
- |
088 |
为jourald配置日志轮换失败。 |
检查与托管VM的主机兼容的VM网络设置。您可以尝试迁移到其他主机并重新启动虚拟机。 |
089 |
更改摘要日志轮换配置文件的所有权失败。 |
重新启动VM。 |