解决管理节点和用户界面问题
您可以执行多项任务来帮助确定与管理节点和StorageGRID用户界面相关的问题的来源。
管理节点登录错误
如果您在登录StorageGRID管理节点时遇到错误,则您的系统可能存在问题"联网"或者 "硬件"问题,一个问题"管理节点服务"或"Cassandra 数据库问题"在连接的存储节点上。
-
您已使用"支持的网络浏览器"。
-
你有 `Passwords.txt`文件。
-
你有"特定访问权限"。
如果您在尝试登录管理节点时看到以下任何错误消息,请使用这些故障排除指南:
-
Your credentials for this account were invalid. Please try again.
-
Waiting for services to start…
-
Internal server error. The server encountered an error and could not complete your request. Please try again. If the problem persists, contact Technical Support.
-
Unable to communicate with server. Reloading page…
-
等待 10 分钟,然后尝试再次登录。
如果错误未自动解决,请转到下一步。
-
如果您的StorageGRID系统有多个管理节点,请尝试从另一个管理节点登录到网格管理器以检查不可用管理节点的状态。
-
如果您能够登录,您可以使用*Dashboard*、NODES、*Alerts*和*SUPPORT*选项来帮助确定错误的原因。
-
如果您只有一个管理节点或者仍然无法登录,请转到下一步。
-
-
确定节点的硬件是否处于离线状态。
-
如果您的StorageGRID系统启用了单点登录 (SSO),请参阅"配置单点登录"。
您可能需要暂时禁用并重新启用单个管理节点的 SSO 来解决任何问题。
如果启用了 SSO,则您无法使用受限端口登录。您必须使用端口 443。 -
确定您使用的帐户是否属于联合用户。
如果联合用户帐户不起作用,请尝试以本地用户(例如 root)身份登录网格管理器。
-
如果本地用户可以登录:
-
查看警报。
-
选择*配置* > 访问控制 > 身份联合。
-
单击“测试连接”以验证 LDAP 服务器的连接设置。
-
如果测试失败,请解决任何配置错误。
-
-
如果本地用户无法登录,并且您确信凭据正确,请转到下一步。
-
-
使用安全外壳(ssh)登录管理节点:
-
输入以下命令:
ssh admin@Admin_Node_IP
-
输入 `Passwords.txt`文件。
-
输入以下命令切换到root:
su -
-
输入 `Passwords.txt`文件。
当您以 root 身份登录时,提示符将从
$`到 `#
。
-
-
查看网格节点上所有服务运行状态:
storagegrid-status
确保 nms、mi、nginx 和 mgmt api 服务都在运行。
如果服务状态发生变化,输出会立即更新。
$ storagegrid-status Host Name 99-211 IP Address 10.96.99.211 Operating System Kernel 4.19.0 Verified Operating System Environment Debian 10.1 Verified StorageGRID Webscale Release 11.4.0 Verified Networking Verified Storage Subsystem Verified Database Engine 5.5.9999+default Running Network Monitoring 11.4.0 Running Time Synchronization 1:4.2.8p10+dfsg Running ams 11.4.0 Running cmn 11.4.0 Running nms 11.4.0 Running ssm 11.4.0 Running mi 11.4.0 Running dynip 11.4.0 Running nginx 1.10.3 Running tomcat 9.0.27 Running grafana 6.4.3 Running mgmt api 11.4.0 Running prometheus 11.4.0 Running persistence 11.4.0 Running ade exporter 11.4.0 Running alertmanager 11.4.0 Running attrDownPurge 11.4.0 Running attrDownSamp1 11.4.0 Running attrDownSamp2 11.4.0 Running node exporter 0.17.0+ds Running sg snmp agent 11.4.0 Running
-
确认 nginx-gw 服务正在运行
# service nginx-gw status
-
使用 Lumberjack 收集日志:
# /usr/local/sbin/lumberjack.rb
如果身份验证失败发生在过去,您可以使用 --start 和 --end Lumberjack 脚本选项来指定适当的时间范围。使用 lumberjack -h 了解这些选项的详细信息。
终端的输出指示日志存档已被复制到哪里。
-
-
/var/local/log/bycast.log
-
/var/local/log/bycast-err.log
-
/var/local/log/nms.log
-
**/*commands.txt
-
-
如果您无法识别管理节点的任何问题,请发出以下任一命令来确定在您的站点上运行 ADC 服务的三个存储节点的 IP 地址。通常,这些是站点上安装的前三个存储节点。
# cat /etc/hosts
# gpt-list-services adc
管理节点在身份验证过程中使用 ADC 服务。
-
从管理节点,使用 ssh 登录到每个 ADC 存储节点,使用您确定的 IP 地址。
-
查看网格节点上所有服务运行状态:
storagegrid-status
确保 idnt、acct、nginx 和 cassandra 服务都在运行。
-
重复步骤使用 Lumberjack 收集日志和审查日志查看存储节点上的日志。
-
如果您无法解决问题,请联系技术支持。
将您收集的日志提供给技术支持。另请参阅"日志文件参考" 。
用户界面问题
StorageGRID软件升级后,网格管理器或租户管理器的用户界面可能无法按预期响应。
-
确保你使用的是"支持的网络浏览器"。
-
清除您的网络浏览器缓存。
清除缓存会删除以前版本的StorageGRID软件使用的过时资源,并允许用户界面再次正常运行。有关说明,请参阅 Web 浏览器的文档。