Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

检查数据修复作业

贡献者

停用网格节点之前,您必须确认没有处于活动状态的数据修复作业。如果任何修复失败,您必须重新启动修复并让其完成,然后再执行停用操作步骤 。

如果您需要停用已断开连接的存储节点、还需要在停用操作步骤 完成后完成这些步骤、以确保数据修复作业已成功完成。您必须确保已成功还原已删除节点上的任何经过擦除编码的片段。

这些步骤仅适用于具有纠删编码对象的系统。

  1. 登录到主管理节点:

    1. 输入以下命令: ssh admin@grid_node_IP

      以root用户身份登录后、提示符将从变为 $ to #

    2. 输入中列出的密码 Passwords.txt 文件

    3. 输入以下命令切换到root: su -

    4. 输入中列出的密码 Passwords.txt 文件

  2. 检查正在运行的修复: repair-data show-ec-repair-status

    • 如果您从未运行过数据修复作业、则输出为 No job found。您无需重新启动任何修复作业。

    • 如果数据修复作业先前已运行或当前正在运行,则输出将列出要修复的信息。每个修复都有一个唯一的修复 ID 。继续执行下一步。

    • 您还可以监控正在进行的还原作业的状态、并查看中已完成的还原作业的历史记录"网格管理器"

    修复数据状态
  3. 所有修复的状态为 Completed,则不需要重新启动任何修复作业。

  4. 任何修复的状态为 Stopped、您必须重新启动此修复。

    1. 从输出中获取失败修复的修复 ID 。

    2. 运行 repair-data start-ec-node-repair 命令:

      使用 --repair-id 用于指定修复ID的选项。例如、如果要重试修复ID为949292的修复、请运行以下命令: repair-data start-ec-node-repair --repair-id 949292

    3. 继续跟踪EC数据修复的状态、直到所有修复的状态为 Completed