响应因 HA 接管而导致的动态性能事件
您可以使用 Unified Manager 调查高可用性( HA )对中的集群节点上的高数据处理导致的性能事件。此外,您还可以使用 Unified Manager 检查节点的运行状况,以查看节点上检测到的任何近期运行状况事件是否会引发性能事件。
-
您需要的内容 *
-
您必须具有操作员,应用程序管理员或存储管理员角色。
-
必须存在新的,已确认的或已废弃的性能事件。
-
显示 * 事件详细信息 * 页面以查看有关事件的信息。
-
请阅读 * 问题描述 * ,其中介绍了事件中涉及的工作负载以及争用的集群组件。
有一个受影响的卷的延迟受争用集群组件的影响。数据处理节点接管其配对节点中的所有工作负载,它是处于争用状态的集群组件。在争用组件下,数据处理图标将以红色突出显示,而在事件发生时处理数据处理的节点的名称将显示在圆括号中。
-
在 * 问题描述 * 中,单击卷的名称。
此时将显示卷性能资源管理器页面。在页面顶部的事件时间行中,更改事件图标()表示Unified Manager检测到HA接管开始的时间。
-
将光标指向 HA 接管的更改事件图标,有关 HA 接管的详细信息将以悬停文本的形式显示。
在延迟图表中,事件表示选定卷在与 HA 接管大致相同的时间内因延迟较长而超过性能阈值。
-
单击 * 缩放视图 * 可在新页面上显示延迟图表。
-
在视图菜单中,选择 * 集群组件 * 以按集群组件查看总延迟。
-
将鼠标光标指向 HA 接管开始时的更改事件图标,并将数据处理延迟与总延迟进行比较。
在 HA 接管时,数据处理节点上的工作负载需求增加,导致数据处理出现高峰。CPU 利用率的提高会导致延迟并触发事件。
-
修复故障节点后,请使用 ONTAP 系统管理器执行 HA 交还,从而将工作负载从配对节点移至固定节点。
-
HA 交还完成后,在 Unified Manager 中进行下一次配置发现(大约 15 分钟)后,在 * 事件管理 * 清单页面中找到 HA 接管触发的事件和工作负载。
现在,由 HA 接管触发的事件的状态为已废弃,这表示该事件已解决。数据处理组件的延迟已减少,从而降低了总延迟。选定卷当前用于数据处理的节点已解决此事件。