对登录错误进行故障排除

如果您在登录到 StorageGRID 管理节点 StorageGRID 时遇到错误,则系统可能存在身份联合配置问题,网络或硬件问题,管理节点服务问题或已连接存储节点上的 Cassandra 数据库问题。

开始之前

关于本任务

如果在尝试登录到管理节点时看到以下任何错误消息,请遵循以下故障排除准则:
  • 您的此帐户凭据无效。请重试。
  • 正在等待服务启动 ...
  • 内部服务器错误。服务器遇到错误,无法完成您的请求。请重试。如果问题仍然存在,请联系技术支持。
  • 无法与服务器通信。正在重新加载页面 ...

过程

  1. 等待 10 分钟,然后重新尝试登录。
    如果此错误未自动解决,请转至下一步。
  2. 如果 StorageGRID 系统具有多个管理节点,请尝试 网格管理器 从另一个管理节点登录到。
    • 如果您能够登录,则可以使用 DashboardNodesAlarmsSupport > Grid Topology 选项帮助确定错误的原因。
    • 如果只有一个管理节点,或者您仍然无法登录,请转至下一步。
  3. 确定节点的硬件是否脱机。
  4. 如果 StorageGRID 系统启用了单点登录( Single Sign-On , SSO ),请参阅 StorageGRID》中有关配置单点登录的步骤。
    要解决任何问题,您可能需要暂时禁用并重新启用单个管理节点的 SSO 。
    注: 如果启用了 SSO ,则无法使用受限端口登录。必须使用端口 443 。
  5. 确定您正在使用的帐户是否属于联合用户。
    如果此联合用户帐户不起作用,请尝试 网格管理器 以本地用户(例如 root )身份登录到。
    • 如果本地用户可以登录:
      1. 查看显示的任何警报。
      2. 选择Configuration > Identity Federation
      3. 单击 Test Connection 以验证 LDAP 服务器的连接设置。
      4. 如果测试失败,请解决任何配置错误。
    • 如果本地用户无法登录,并且您确信凭据正确无误,请转至下一步。
  6. 使用安全 Shell ( ssh )登录到管理节点:
    1. 输入以下命令: SSH admin@Admin_Node_IP
    2. 输入 Passwords.txt 文件中列出的密码。
    3. 输入以下命令切换到 root : su -
    4. 输入 Passwords.txt 文件中列出的密码。
      以 root 用户身份登录时,提示符将从 $ 更 改为 #
  7. 查看网格节点上运行的所有服务的状态: storagegrid-status
    确保 nmsminginxmgmt api 服务均已运行。
    如果服务状态发生变化,输出将立即更新。
    $ storagegRid-status
    主机名 99-211
    IP 地址 10.96.99.211
    操作系统内核 4.9.0 已验证
    操作系统环境 Debian 9.6 已验证
    StorageGRID Webscale 11.2.0 版 已验证
    网络连接 已验证
    存储子系统 已验证
    数据库引擎 5.5.9999+ 默认运行
    网络监控 11.2.0 正在运行
    时间同步 1 : 4.2.8p10+dfsg 正在运行
    AMS 11.2.0 正在运行
    CMN 11.2.0 正在运行
    NMS 11.2.0 正在运行
    SSM 11.2.0 正在运行
    英里 11.2.0 正在运行
    dynip 11.2.0 正在运行
    nginx 1.10.3 正在运行
    Tomcat 8.5.14 正在运行
    Grafana 4.2.0 正在运行
    管理 API 11.2.0 正在运行
    Prometheus 11.2.0 正在运行
    持久性 11.2.0 正在运行
    和出口 11.2.0 正在运行
    alertmanager 11.2.0 正在运行
    attrDownPurge 11.2.0 正在运行
    attrDownSamp1 11.2.0 正在运行
    attrDownSamp2 11.2.0 正在运行
    节点导出器 0.13.0+DS 正在运行
    SG SNMP 代理 11.2.0 正在运行
  8. 确认 Apache Web 服务器正在运行: # service apache2 status
  9. 使用 Lumberjack 收集日志: # /usr/local/sbin/lumberjack.rb
    如果身份验证在过去失败,您可以使用 –start–end Lumberjack 脚本选项指定适当的时间范围。有关 lumberjack -h 这些选项的详细信息,请使用。

    终端的输出指示日志归档的复制位置。

  10. 查看以下日志:
    • /var/local/log/bycast.log
    • /var/local/log/bycast-err.log
    • /var/local/log/nms.log
    • **/*commands.txt
  11. 如果您无法确定管理节点存在任何问题,请发出以下任一命令,以确定在您的站点上运行此 ADC 服务的三个存储节点的 IP 地址。通常,这些存储节点是站点上安装的前三个存储节点。
    # cat /etc/hosts
    # vi /var/local/GPT-data/specs/grid.xml
    管理节点会在身份验证过程中使用此 ADC 服务。
  12. 从管理节点中,使用您确定的 IP 地址登录到每个 ADC 存储节点。
    1. 输入以下命令: SSH admin@grid_node_IP
    2. 输入 Passwords.txt 文件中列出的密码。
    3. 输入以下命令切换到 root : su -
    4. 输入 Passwords.txt 文件中列出的密码。
      以 root 用户身份登录时,提示符将从 $ 更 改为 #
  13. 查看网格节点上运行的所有服务的状态: storagegrid-status
    确保 idntacctnginxcassandra 服务均已运行。
  14. 重复步骤 910 以查看存储节点上的日志。
  15. 如果无法解决此问题,请联系技术支持。
    将收集的日志提供给技术支持。