正在检查数据修复作业

在删除网格节点之前,您必须确认没有处于活动状态的数据修复作业。如果任何修复失败,您必须在执行停用操作步骤之前重新启动它们。如果您需要停用已断开连接的存储节点,则还需要在停用操作步骤完成后完成这些步骤。您必须确保已成功还原已删除节点上的任何经过擦除编码的片段。

关于本任务

这些步骤仅适用于具有纠删编码对象的系统。

过程

  1. 从服务笔记本电脑登录到主管理节点:
    1. 输入以下命令: SSH admin@grid_node_IP
      以 root 用户身份登录时,提示符将从 $ 更 改为 #
    2. 输入 Passwords.txt 文件中列出的密码。
    3. 输入以下命令切换到 root : su -
    4. 输入 Passwords.txt 文件中列出的密码。
  2. 检查正在运行的修复: repair-data show-ec-repair-status
    • 如果您从未运行过数据修复作业,则输出为 未找到作业。您无需重新启动任何修复作业。
    • 如果数据修复作业先前已运行或当前正在运行,则输出将列出要修复的信息。每个修复都有一个唯一的修复 ID 。转至下一步。
    root@DC1-ADM1:~ # repair-data show-ec-repair-status                      
    
     Repair ID   Scope                   Start Time  End Time  State  Est Bytes Affected Bytes Repaired  Retry Repair
    ==========================================================================================================
     949283   DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:27:06.9  Success   17359            17359           No
     949292   DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:37:06.9  Failure   17359            0               Yes
     949294   DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:47:06.9  Failure   17359            0               Yes
     949299   DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:57:06.9  Failure   17359            0               Yes
    
    
  3. 如果所有修复的状态为 成功,则无需重新启动任何修复作业。
  4. 如果任何修复的状态为 failure,则必须重新启动该修复。
    1. 从输出中获取失败修复的修复 ID 。
    2. 运行 repair-data start-ec-node-repair 命令。

      使用 -repair-id 选项指定修复 ID 。例如,如果要重试修复 ID 为 949292 的修复,请运行以下命令: repair-data start-ec-node-repair --repair-id 949292

    3. 继续跟踪 EC 数据修复的状态,直到所有修复的状态为 成功为止。