正在运行前台验证

使用前台验证可以验证存储节点上是否存在数据。缺少对象数据可能表示底层存储设备存在问题。

开始之前

关于本任务

前台验证将检查是否缺少复制的对象数据和缺少纠删编码的对象数据:
  • 如果前台验证发现大量缺少对象数据,则存储节点的存储可能存在问题,需要调查和解决。
  • 如果前台验证发现与纠删编码数据相关的严重存储错误,它将通知您。要修复此错误,您必须执行存储卷恢复。

您可以将前台验证配置为检查存储节点的所有对象存储或仅检查特定对象存储。

如果前台验证发现缺少对象数据, StorageGRID 系统将尝试替换该对象数据。如果无法创建替代副本,则可能会触发丢失(对象丢失)警报。

前台验证会生成 LDR 前台验证网格任务,根据存储在存储节点上的对象数量,该任务可能需要数天或数周才能完成。可以同时选择多个存储节点;但是,这些网格任务不会同时运行。相反,它们会排队并逐个运行,直到完成。在存储节点上执行前台验证时,即使用于验证其他卷的选项可能会显示为可用于此存储节点,您也无法在同一存储节点上启动另一个前台验证任务。

如果运行前台验证的存储节点以外的存储节点脱机,网格任务将继续运行,直到 % Complete 属性达到 99.99% 。% Complete 然后,该属性回退到 50% ,并等待存储节点返回联机状态。当存储节点的状态恢复为联机时, LDR 前台验证网格任务将继续执行,直到完成为止。

过程

  1. 选择 Storage Node > LDR > Verification
  2. 单击 Configuration > Main
  3. 在下 Foreground Verification,选中要验证的每个存储卷 ID 对应的复选框。

    前台验证配置页面
  4. 单击 Apply Changes

    等待页面自动刷新并重新加载,然后再退出页面。刷新后,对象存储将无法在该存储节点上选择。

    此时将生成并运行 LDR 前台验证网格任务,直到任务完成,暂停或中止为止。
  5. 监控缺少的对象或缺少的片段:
    1. 选择 Storage Node > LDR > Verification
    2. 在概述选项卡上的下 Verification Results,记下的值 Missing Objects Detected
      如果属性的计数 Missing Objects Detected 较大(如果缺少数百个对象),则存储节点的存储可能存在问题。请联系技术支持。
    3. 选择Storage Node > LDR > Erasure Coding
    4. 在概述选项卡上的下 Verification Results,记下的值 Missing Fragments Detected
      如果属性的计数 Missing Fragments Detected 较大(如果缺少数百个片段),则存储节点的存储可能会出现问题。请联系技术支持。

    如果前台验证未检测到大量缺少的复制对象副本或大量缺少的片段,则存储将正常运行。

  6. 监控前台验证网格任务的完成情况:
    1. 选择 Support > Grid Topology 然后选择 site > Admin Node > CMN > Grid Task > Overview > Main
    2. 验证前台验证网格任务是否正在无错误地进行。
      注: 如果前台验证网格任务暂停,则会针对网格任务状态( SCA )触发通知级别警报。
    3. 如果网格任务暂停并 出现严重存储错误,请恢复受影响的卷,然后对其余卷运行前台验证以检查是否存在其他错误。
      注意: 如果前台验证网格任务暂停,并显示消息 "Recovering a critical storage error in volume" volID(在卷中遇到严重存储错误),则必须执行恢复故障存储卷的过程。请参见恢复和维护说明。

下一步操作

如果您仍对数据完整性有顾虑,请访问 LDR > Verification > Configuration > Main 并提高后台验证率。后台验证会检查所有已存储对象数据的准确性,并修复发现的任何问题。尽快发现并修复潜在问题可降低数据丢失的风险。