Skip to main content
本产品推出了新版本。
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

对管理节点和用户界面问题进行故障排除

贡献者

您可以执行多项任务来帮助确定与管理节点和 StorageGRID 用户界面相关的问题的根源。

登录错误

如果您在登录到StorageGRID 管理节点时遇到错误、则您的系统可能具有具有的问题描述 "身份联合配置"、A "网络连接""硬件" 问题、使用的问题描述 "管理节点服务""使用Cassand拉 数据库的问题描述" 已连接存储节点上。

开始之前
关于此任务

如果在尝试登录到管理节点时看到以下任何错误消息,请遵循以下故障排除准则:

  • Your credentials for this account were invalid. Please try again.

  • Waiting for services to start…​

  • Internal server error. The server encountered an error and could not complete your request. Please try again. If the problem persists, contact Technical Support.

  • Unable to communicate with server. Reloading page…​

步骤
  1. 等待 10 分钟,然后重新尝试登录。

    如果此错误未自动解决,请转至下一步。

  2. 如果您的 StorageGRID 系统具有多个管理节点,请尝试从另一个管理节点登录到网格管理器。

    • 如果您能够登录,则可以使用 * 信息板 * , * 节点 * , * 警报 * 和 * 支持 * 选项来帮助确定错误的发生原因 。

    • 如果您只有一个管理节点或仍无法登录、请转到下一步。

  3. 确定节点的硬件是否脱机。

  4. 如果您的StorageGRID 系统启用了单点登录(SSO)、请参阅的步骤 "配置单点登录"

    要解决任何问题,您可能需要暂时禁用并重新启用单个管理节点的 SSO 。

    备注 如果启用了SSO、则无法使用受限端口登录。必须使用端口 443 。
  5. 确定您正在使用的帐户是否属于联合用户。

    如果此联合用户帐户不起作用,请尝试以本地用户(例如 root )身份登录到网格管理器。

    • 如果本地用户可以登录:

      1. 查看显示的任何警报。

      2. 选择 * 配置 * > * 访问控制 * > * 身份联合 * 。

      3. 单击 * 测试连接 * 以验证 LDAP 服务器的连接设置。

      4. 如果测试失败,请解决任何配置错误。

    • 如果本地用户无法登录、并且您确信凭据正确无误、请转至下一步。

  6. 使用安全 Shell ( ssh )登录到管理节点:

    1. 输入以下命令: ssh admin@Admin_Node_IP

    2. 输入中列出的密码 Passwords.txt 文件

    3. 输入以下命令切换到root: su -

    4. 输入中列出的密码 Passwords.txt 文件

      以root用户身份登录后、提示符将从变为 $ to #

  7. 查看网格节点上运行的所有服务的状态: storagegrid-status

    确保 NMS , Mi , nginx 和 mgmt API 服务均已运行。

    如果服务状态发生变化,输出将立即更新。

    $ storagegrid-status
    Host Name                      99-211
    IP Address                     10.96.99.211
    Operating System Kernel        4.19.0         Verified
    Operating System Environment   Debian 10.1    Verified
    StorageGRID Webscale Release   11.4.0         Verified
    Networking                                    Verified
    Storage Subsystem                             Verified
    Database Engine                5.5.9999+default Running
    Network Monitoring             11.4.0         Running
    Time Synchronization           1:4.2.8p10+dfsg Running
    ams                            11.4.0         Running
    cmn                            11.4.0         Running
    nms                            11.4.0         Running
    ssm                            11.4.0         Running
    mi                             11.4.0         Running
    dynip                          11.4.0         Running
    nginx                          1.10.3         Running
    tomcat                         9.0.27         Running
    grafana                        6.4.3          Running
    mgmt api                       11.4.0         Running
    prometheus                     11.4.0         Running
    persistence                    11.4.0         Running
    ade exporter                   11.4.0         Running
    alertmanager                   11.4.0         Running
    attrDownPurge                  11.4.0         Running
    attrDownSamp1                  11.4.0         Running
    attrDownSamp2                  11.4.0         Running
    node exporter                  0.17.0+ds      Running
    sg snmp agent                  11.4.0         Running
  8. 确认Ngins-GW服务正在运行 # service nginx-gw status

  9. [[use_Lumberjack_to _col收集_logs、start=9]]使用Lumberjack收集日志: # /usr/local/sbin/lumberjack.rb

    如果身份验证在过去失败,您可以使用 -start 和 -end Lumberjack 脚本选项指定适当的时间范围。有关这些选项的详细信息,请使用 lumberjack -h 。

    终端的输出指示日志归档的复制位置。

  10. 【 review_logs , start=10]] 查看以下日志:

    • /var/local/log/bycast.log

    • /var/local/log/bycast-err.log

    • /var/local/log/nms.log

    • **/*commands.txt

  11. 如果您无法确定管理节点存在任何问题问题描述 ,请执行以下任一命令来确定在您的站点上运行此 ADA 服务的三个存储节点的 IP 地址。通常,这些存储节点是站点上安装的前三个存储节点。

    # cat /etc/hosts
    # vi /var/local/gpt-data/specs/grid.xml

    管理节点会在身份验证过程中使用此 ADC 服务。

  12. 从管理节点中,使用您确定的 IP 地址登录到每个 ADC 存储节点。

    1. 输入以下命令: ssh admin@grid_node_IP

    2. 输入中列出的密码 Passwords.txt 文件

    3. 输入以下命令切换到root: su -

    4. 输入中列出的密码 Passwords.txt 文件

      以root用户身份登录后、提示符将从变为 $ to #

  13. 查看网格节点上运行的所有服务的状态: storagegrid-status

    确保 idnt , Acct , nginx 和 Cassandra 服务均已运行。

  14. 重复步骤 使用 Lumberjack 收集日志查看日志 查看存储节点上的日志。

  15. If you are unable to resolve the issue, contact technical support.

    将收集的日志提供给技术支持。另请参见 "日志文件参考"

用户界面问题

升级StorageGRID 软件后、网格管理器或租户管理器的用户界面可能无法按预期响应。

步骤
  1. 确保您使用的是 "支持的 Web 浏览器"

    备注 浏览器支持可能会随每个StorageGRID 版本的不同而有所不同。确认您使用的浏览器受您的StorageGRID 版本支持。
  2. 清除 Web 浏览器缓存。

    清除缓存将删除先前版本的 StorageGRID 软件所使用的过时资源,并允许用户界面再次正常运行。有关说明,请参见 Web 浏览器的文档。

管理节点不可用

如果 StorageGRID 系统包含多个管理节点,则可以使用另一个管理节点检查不可用管理节点的状态。

开始之前

您必须具有特定的访问权限。

步骤
  1. 从可用的管理节点中,使用登录到网格管理器 "支持的 Web 浏览器"

  2. 选择 * 支持 * > * 工具 * > * 网格拓扑 * 。

  3. 选择 * 站点 * > * 不可用管理节点 _* > * SSM* > * 服务 * > * 概述 * > * 主 * 。

  4. 查找状态为未运行且可能也显示为蓝色的服务。

    周围文本所述的屏幕截图
  5. 确定是否已触发警报。

  6. 采取适当的操作解决问题描述 。