响应由 HA 接管引起的动态性能事件
您可以使用 Unified Manager 调查由高可用性 (HA) 对中的集群节点上的高数据处理引起的性能事件。您还可以使用 Unified Manager 检查节点的运行状况,以查看在节点上检测到的任何近期运行状况事件是否导致了性能事件。
-
您必须具有操作员、应用程序管理员或存储管理员角色。
-
必须有新的、公认的或过时的绩效事件。
-
显示*活动详情*页面以查看有关活动的信息。
-
阅读*描述*,其中描述了事件所涉及的工作负载和争用的集群组件。
有一个受害卷的延迟受到争用的集群组件的影响。数据处理节点从其伙伴节点接管了所有工作负载,是处于争用的集群组件。在“争用中的组件”下, “Data Processing”图标以红色突出显示,并且在事件发生时处理数据处理的节点的名称显示在括号中。
-
在“描述”中,单击卷的名称。
将显示卷性能资源管理器页面。在页面顶部的事件时间线中,有一个更改事件图标 (
) 表示 Unified Manager 检测到 HA 接管开始的时间。
-
将光标指向 HA 接管的更改事件图标,悬停文本将显示有关 HA 接管的详细信息。
在延迟图表中,事件表明所选卷在 HA 接管的同时由于高延迟而超过了性能阈值。
-
单击“缩放视图”以在新页面上显示延迟图表。
-
在“查看”菜单中,选择“集群组件”以查看集群组件的总延迟。
-
将鼠标光标指向 HA 接管开始的更改事件图标,并将数据处理的延迟与总延迟进行比较。
在 HA 接管时,由于数据处理节点上的工作负载需求增加,数据处理量出现激增。 CPU 利用率的增加增加了延迟并触发了该事件。
-
修复故障节点后,使用ONTAP系统管理器执行 HA 交还,将工作负载从合作伙伴节点移动到已修复的节点。
-
HA 交还完成后,在 Unified Manager 中进行下一次配置发现(大约 15 分钟)后,在 事件管理 库存页面中找到由 HA 接管触发的事件和工作负载。
HA 接管触发的事件现在处于过时状态,这表明该事件已解决。数据处理组件的延迟减少了,从而降低了总延迟。选定卷现在用于数据处理的节点已解决该事件。