Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

恢复主管理节点时还原 Prometheus 指标

贡献者

或者,您也可以在出现故障的主管理节点上保留 Prometheus 维护的历史指标。只有当您的 StorageGRID 系统包含另一个管理节点时,才能还原 Prometheus 指标。

  • 必须安装并运行已恢复的管理节点。

  • StorageGRID 系统必须至少包含两个管理节点。

  • 您必须具有 passwords.txt 文件。

  • 您必须具有配置密码短语。

如果管理节点出现故障,则在管理节点上的 Prometheus 数据库中维护的指标将丢失。恢复管理节点后,软件安装过程将创建一个新的 Prometheus 数据库。在启动已恢复的管理节点后,它会将指标记录为您已执行 StorageGRID 系统的新安装。

如果您还原了主管理节点,并且 StorageGRID 系统具有另一个管理节点,则可以通过将 Prometheus 数据库从非主管理节点( _source 管理节点 _ )复制到已恢复的主管理节点来还原历史指标。如果您的系统只有主管理节点,则无法还原 Prometheus 数据库。

备注 复制 Prometheus 数据库可能需要一个小时或更长时间。在源管理节点上停止服务时,某些 Grid Manager 功能将不可用。
  1. 登录到源管理节点:

    1. 输入以下命令: ssh admin@ grid_node_ip_

    2. 输入 passwords.txt 文件中列出的密码。

    3. 输入以下命令切换到 root : su -

    4. 输入 passwords.txt 文件中列出的密码。

  2. 从源管理节点中,停止 Prometheus 服务: sservice Prometheus stop

  3. 在已恢复的管理节点上完成以下步骤:

    1. 登录到已恢复的管理节点:

      1. 输入以下命令: ssh admin@ grid_node_ip_

      2. 输入 passwords.txt 文件中列出的密码。

      3. 输入以下命令切换到 root : su -

      4. 输入 passwords.txt 文件中列出的密码。

    2. 停止 Prometheus 服务: sservice Prometheus stop

    3. 将 SSH 专用密钥添加到 SSH 代理。输入:ssh-add

    4. 输入 passwords.txt 文件中列出的 SSH 访问密码。

    5. 将 Prometheus 数据库从源管理节点复制到已恢复的管理节点: ` /usr/local/Prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP`

    6. 出现提示时,按 * 输入 * 确认要销毁已恢复管理节点上的新 Prometheus 数据库。

      原始 Prometheus 数据库及其历史数据将复制到已恢复的管理节点。完成复制操作后,此脚本将启动已恢复的管理节点。此时将显示以下状态:

    已克隆数据库,正在启动服务

    1. 如果不再需要对其他服务器进行无密码访问,请从 SSH 代理中删除私钥。输入:ssh-add -D

  4. 在源管理节点上重新启动 Prometheus 服务。 sservice Prometheus start