对管理节点和用户界面问题进行故障排除
您可以执行多项任务来帮助确定与管理节点和StorageGRID用户界面相关的问题的根源。
管理节点登录错误
如果您在登录到StorageGRID管理节点时遇到错误,则系统可能会遇到"网络连接"或 "硬件"问题、"管理节点服务"或"使用Cassand拉 数据库的问题描述"已连接存储节点上的问题。
-
您已使用登录到网格管理器"支持的 Web 浏览器"。
-
您已获得 `Passwords.txt`文件。
-
您拥有 "特定访问权限"。
如果在尝试登录到管理节点时看到以下任何错误消息,请遵循以下故障排除准则:
-
Your credentials for this account were invalid. Please try again.
-
Waiting for services to start…
-
Internal server error. The server encountered an error and could not complete your request. Please try again. If the problem persists, contact Technical Support.
-
Unable to communicate with server. Reloading page…
-
等待 10 分钟,然后重新尝试登录。
如果此错误未自动解决,请转至下一步。
-
如果您的StorageGRID系统具有多个管理节点、请尝试从另一个管理节点登录到网格管理器、以检查不可用管理节点的状态。
-
如果您能够登录,则可以使用 * 信息板 * , * 节点 * , * 警报 * 和 * 支持 * 选项来帮助确定错误的发生原因 。
-
如果您只有一个管理节点或仍无法登录、请转到下一步。
-
-
确定节点的硬件是否脱机。
-
如果为StorageGRID系统启用了单点登录(SSO),请参阅的步骤"配置单点登录"。
要解决任何问题,您可能需要暂时禁用并重新启用单个管理节点的 SSO 。
如果启用了SSO、则无法使用受限端口登录。必须使用端口 443 。 -
确定您正在使用的帐户是否属于联合用户。
如果此联合用户帐户不起作用,请尝试以本地用户(例如 root )身份登录到网格管理器。
-
如果本地用户可以登录:
-
查看警报。
-
选择 * 配置 * > * 访问控制 * > * 身份联合 * 。
-
单击 * 测试连接 * 以验证 LDAP 服务器的连接设置。
-
如果测试失败,请解决任何配置错误。
-
-
如果本地用户无法登录、并且您确信凭据正确无误、请转至下一步。
-
-
使用安全 Shell ( ssh )登录到管理节点:
-
输入以下命令:
ssh admin@Admin_Node_IP
-
输入文件中列出的密码
Passwords.txt
。 -
输入以下命令切换到root:
su -
-
输入文件中列出的密码
Passwords.txt
。当您以root用户身份登录时,提示符将从更
$`改为 `#
。
-
-
查看网格节点上正在运行的所有服务的状态:
storagegrid-status
确保 NMS , Mi , nginx 和 mgmt API 服务均已运行。
如果服务状态发生变化,输出将立即更新。
$ storagegrid-status Host Name 99-211 IP Address 10.96.99.211 Operating System Kernel 4.19.0 Verified Operating System Environment Debian 10.1 Verified StorageGRID Webscale Release 11.4.0 Verified Networking Verified Storage Subsystem Verified Database Engine 5.5.9999+default Running Network Monitoring 11.4.0 Running Time Synchronization 1:4.2.8p10+dfsg Running ams 11.4.0 Running cmn 11.4.0 Running nms 11.4.0 Running ssm 11.4.0 Running mi 11.4.0 Running dynip 11.4.0 Running nginx 1.10.3 Running tomcat 9.0.27 Running grafana 6.4.3 Running mgmt api 11.4.0 Running prometheus 11.4.0 Running persistence 11.4.0 Running ade exporter 11.4.0 Running alertmanager 11.4.0 Running attrDownPurge 11.4.0 Running attrDownSamp1 11.4.0 Running attrDownSamp2 11.4.0 Running node exporter 0.17.0+ds Running sg snmp agent 11.4.0 Running
-
确认Ngins-GW服务正在运行
# service nginx-gw status
-
[[use_Lumberjack_to _col收集_logs]]使用Lumberjack收集日志:
# /usr/local/sbin/lumberjack.rb
如果身份验证在过去失败,您可以使用 -start 和 -end Lumberjack 脚本选项指定适当的时间范围。有关这些选项的详细信息,请使用 lumberjack -h 。
终端的输出指示日志归档的复制位置。
-
【 review_logs , start=10]] 查看以下日志:
-
/var/local/log/bycast.log
-
/var/local/log/bycast-err.log
-
/var/local/log/nms.log
-
**/*commands.txt
-
-
如果您无法确定管理节点存在任何问题问题描述 ,请执行以下任一命令来确定在您的站点上运行此 ADA 服务的三个存储节点的 IP 地址。通常,这些存储节点是站点上安装的前三个存储节点。
# cat /etc/hosts
# gpt-list-services adc
管理节点会在身份验证过程中使用此 ADC 服务。
-
在管理节点中、使用ssh使用您标识的IP地址登录到每个ADC存储节点。
-
查看网格节点上正在运行的所有服务的状态:
storagegrid-status
确保 idnt , Acct , nginx 和 Cassandra 服务均已运行。
-
重复步骤使用 Lumberjack 收集日志和查看日志以查看存储节点上的日志。
-
If you are unable to resolve the issue, contact technical support.
将收集的日志提供给技术支持。另请参见"日志文件参考"。
用户界面问题
升级StorageGRID 软件后、网格管理器或租户管理器的用户界面可能无法按预期响应。
-
确保您使用的是"支持的 Web 浏览器"。
-
清除 Web 浏览器缓存。
清除缓存将删除先前版本的 StorageGRID 软件所使用的过时资源,并允许用户界面再次正常运行。有关说明,请参见 Web 浏览器的文档。