Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

正在检查数据修复作业

贡献者

停用网格节点之前,您必须确认没有处于活动状态的数据修复作业。如果任何修复失败,您必须重新启动修复并让其完成,然后再执行停用操作步骤 。

如果您需要停用已断开连接的存储节点,则还需要在停用操作步骤 完成后完成这些步骤,以确保数据修复作业已成功完成。您必须确保已成功还原已删除节点上的任何经过擦除编码的片段。

这些步骤仅适用于具有纠删编码对象的系统。

  1. 登录到主管理节点:

    1. 输入以下命令: ssh admin@grid_node_IP

      以root用户身份登录后、提示符将从变为 $ to #

    2. 输入中列出的密码 Passwords.txt 文件

    3. 输入以下命令切换到root: su -

    4. 输入中列出的密码 Passwords.txt 文件

  2. 检查正在运行的修复: repair-data show-ec-repair-status

    • 如果您从未运行过数据修复作业、则输出为 No job found。您无需重新启动任何修复作业。

    • 如果数据修复作业先前已运行或当前正在运行,则输出将列出要修复的信息。每个修复都有一个唯一的修复 ID 。继续执行下一步。

    root@DC1-ADM1:~ # repair-data show-ec-repair-status
    
    Repair ID Scope Start Time End Time State Est/Affected Bytes Repaired Retry Repair
    ===================================================================================
    949283 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:27:06.9 Success 17359 17359 No
    949292 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:37:06.9 Failure 17359 0     Yes
    949294 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:47:06.9 Failure 17359 0     Yes
    949299 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:57:06.9 Failure 17359 0     Yes
  3. 所有修复的状态为 Success、您无需重新启动任何修复作业。

  4. 任何修复的状态为 Failure、您必须重新启动此修复。

    1. 从输出中获取失败修复的修复 ID 。

    2. 运行 repair-data start-ec-node-repair 命令:

      使用 --repair-id 用于指定修复ID的选项。例如、如果要重试修复ID为949292的修复、请运行以下命令: repair-data start-ec-node-repair --repair-id 949292

    3. 继续跟踪EC数据修复的状态、直到所有修复的状态为 Success