识别问题并对失败的保护作业执行纠正措施
您在“事件详细信息”页面的“原因”字段中查看作业失败错误消息,并确定作业因 Snapshot 副本错误而失败。然后,您可以进入“音量/健康详细信息”页面来收集更多信息。
您必须具有应用程序管理员角色。
事件详细信息页面上的原因字段中提供的错误消息包含有关失败作业的以下文本:
Protection Job Failed. Reason: (Transfer operation for relationship 'cluster2_src_svm:cluster2_src_vol2->cluster3_dst_svm: managed_svc2_vol3' ended unsuccessfully. Last error reported by Data ONTAP: Failed to create Snapshot copy 0426cluster2_src_vol2snap on volume cluster2_src_svm:cluster2_src_vol2. (CSM: An operation failed due to an ONC RPC failure.) Job Details
此消息提供以下信息:
-
备份或镜像作业未成功完成。
该作业涉及源卷之间的保护关系
cluster2_src_vol2`在虚拟服务器上 `cluster2_src_svm`以及目标卷 `managed_svc2_vol3`在名为 `cluster3_dst_svm
。 -
Snapshot 复制作业失败
0426cluster2_src_vol2snap`在源卷上 `cluster2_src_svm:/cluster2_src_vol2
。
在这种情况下,您可以确定作业失败的原因和潜在的纠正措施。但是,解决故障需要您访问系统管理器 Web UI 或ONTAP CLI 命令。
-
您查看错误消息并确定源卷上的 Snapshot 复制作业失败,这表明源卷可能存在问题。
或者,您可以单击错误消息末尾的“作业详细信息”链接,但出于此场景的目的,您选择不这样做。
-
您决定尝试解决该事件,因此执行以下操作:
-
单击“分配给”按钮并从菜单中选择“我”。
-
如果为该事件设置了警报,请单击“确认”按钮,这样您就不会继续收到重复的警报通知。
-
您还可以选择添加有关该事件的注释。
-
-
单击“摘要”窗格中的“源”字段可查看有关源卷的详细信息。
Source 字段包含源对象的名称:在本例中,即计划执行 Snapshot 复制作业的卷。
音量/健康详情页面显示
cluster2_src_vol2
,显示“保护”选项卡的内容。 -
查看保护拓扑图,您会看到与拓扑中第一个卷关联的错误图标,该卷是SnapMirror关系的源卷。
您还会看到源卷图标中的水平条,表示为该卷设置的警告和错误阈值。
-
将光标放在错误图标上,可以看到显示阈值设置的弹出对话框,并看到卷已超过错误阈值,表明存在容量问题。
-
单击“容量”选项卡。
有关卷的容量信息 `cluster2_src_vol2`显示。
-
在“容量”面板中,您会看到条形图中有一个错误图标,再次表明卷容量已超过为该卷设置的阈值水平。
-
在容量图下方,您可以看到卷自动增长已被禁用,并且已设置卷空间保证。
您可以决定启用自动增长,但出于此场景的目的,您决定在决定如何解决容量问题之前进一步调查。
-
您向下滚动到“事件”列表,会看到生成了“保护作业失败”、“卷满天数”和“卷空间满”事件。
-
在*事件*列表中,单击*卷空间已满*事件以获取更多信息,并确定此事件似乎与您的容量问题最相关。
事件详细信息页面显示源卷的卷空间已满事件。
-
在“摘要”区域中,您可以阅读该事件的“原因”字段:
The full threshold set at 90% is breached. 45.38 MB (95.54%) of 47.50 MB is used
。 -
在摘要区域下方,您可以看到建议的纠正措施。
建议的纠正措施仅针对某些事件显示,因此您不会看到针对所有类型事件的此区域。
单击可执行的建议操作列表来解决卷空间已满事件:
-
在此卷上启用自动增长。
-
调整卷大小。
-
在此卷上启用并运行重复数据删除。
-
在此卷上启用并运行压缩。
-
-
您决定在卷上启用自动增长,但要做到这一点,您必须确定父聚合上的可用空间和当前卷增长率:
-
查看父聚合,
cluster2_src_aggr1
,在“相关设备”窗格中。您可以单击聚合的名称以获取有关聚合的更多详细信息。
您确定聚合具有足够的空间来启用卷自动增长。
-
在页面顶部,查看表示关键事件的图标并查看图标下方的文本。
您确定“满员天数:少于一天 | 每日增长率:5.4%”。
-
-
转至系统管理器或访问ONTAP CLI 以启用 `volume autogrow`选项。
记下卷和聚合的名称,以便在启用自动增长时可以使用它们。
-
解决容量问题后,返回 Unified Manager *事件*详细信息页面并将事件标记为已解决。