通过 ILM 监控恢复点目标

您可以跟踪 ILM 评估属性,以确定 ILM 策略定义的 StorageGRID 系统的恢复点目标( RPO )。 StorageGRIDRPO 定义了因站点故障,存储节点故障或这两者导致数据丢失的最大容许期限。

开始之前

您必须使用支持的浏览器登录到网格管理器。

关于本任务

StorageGRID 系统通过应用活动 ILM 策略来管理对象。ILM 策略和关联的 ILM 规则可确定创建的副本数,创建这些副本的方式,适当的放置位置以及每个副本的保留时间长度。

载入或其他活动可能会超过系统处理 ILM 的速率。发生这种情况时,系统可能会开始对无法近乎实时地执行 ILM 的对象进行排队。" 等待 - 客户端 " 图表可用于确定是否发生这种情况。网格管理器 您可以通过转到 Dashboard > Information Lifecycle Management (ILM) > Awaiting - Client 并单击来在中找到图表 图表图标 图标。

此示例图表显示了以下情形:等待 ILM 评估的对象数量以不可持续的方式临时增加,然后最终减少。这种趋势表明, ILM 暂时未近乎实时地完成。


正在等待 - 客户端与时间图表

您可以使用 Nodes 选项卡进一步调查 ILM 队列。

过程

  1. 选择 Nodes
  2. 选择deployment > ILM
  3. 将光标悬停在 ILM Queue 图形上可查看给定时间点以下属性的值:
    • Objects queued (from client operations):由于客户端操作(例如载入)而等待 ILM 评估的对象总数。
    • Objects queued (from all operations):等待 ILM 评估的对象总数。
    • Scan rate (objects/sec):为 ILM 扫描网格中的对象并使其排队的速率。
    • Evaluation rate (objects/sec):根据网格中的 ILM 策略评估对象的当前速率。
  4. 在 ILM 队列部分中,查看以下属性:
    • Scan Period - Estimated:完成对所有对象的完整 ILM 扫描的估计时间。
      注: 完全扫描并不能保证 ILM 已应用于所有对象。
    • Repairs Attempted:已尝试对复制数据执行的对象修复操作总数。每当存储节点尝试修复高风险对象时,此计数都会递增。如果网格繁忙,高风险 ILM 修复会优先处理。
      注: 如果修复后复制失败,则同一对象修复可能会再次增加。

    在监控存储节点卷恢复的进度时,这些属性可能会很有用。如果尝试的修复次数停止增加,并且已完成完整扫描,则修复可能已完成。