Skip to main content
OnCommand Unified Manager 9.5
本产品推出了新版本。
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

响应因 HA 接管而导致的动态性能事件

贡献者

您可以使用 Unified Manager 调查高可用性( HA )对中的集群节点上的高数据处理导致的性能事件。此外,您还可以使用 Unified Manager 检查节点的运行状况,以查看节点上检测到的任何近期运行状况事件是否会引发性能事件。

开始之前

  • 您必须具有操作员、OnCommand 管理员或存储管理员角色。

  • 必须存在新的,已确认的或已废弃的性能事件。

步骤

  1. 显示 * 事件详细信息 * 页面以查看有关事件的信息。

  2. 请阅读 * 问题描述 * ,其中介绍了事件中涉及的工作负载以及争用的集群组件。

    有一个受影响的卷的延迟受争用集群组件的影响。数据处理节点接管其配对节点中的所有工作负载,它是处于争用状态的集群组件。在争用组件下,数据处理图标将以红色突出显示,而在事件发生时处理数据处理的节点的名称将显示在圆括号中。

  3. 在*问题描述 *中、单击受影响卷的名称。

    此时将显示"性能/卷详细信息"页面。在页面底部的事件时间线中、将显示一个更改事件图标(更改事件图标)表示 Unified Manager 检测到 HA 接管开始的时间。

  4. 将光标指向HA接管的更改事件图标。

    有关HA接管的详细信息将显示在事件列表表中。在延迟图表中,事件表示选定卷在与 HA 接管大致相同的时间内因延迟较长而超过性能阈值。

  5. 选择*细分数据依据*。

  6. 在*延迟*下、选择"集群组件"

  7. 单击 * 提交 * 。

    此时将显示"Cluster Components"图表。此图表按集群组件细分总延迟。

  8. 在页面底部、将鼠标指向开始HA接管的更改事件图标。

  9. 在*集群组件*图表中、将数据处理的延迟与*延迟*图表中的总延迟进行比较。

    在 HA 接管时,数据处理节点上的工作负载需求增加,导致数据处理出现高峰。CPU 利用率的提高会导致延迟并触发事件。

  10. 修复故障节点后、请使用OnCommand 系统管理器执行HA交还、从而将工作负载从配对节点移至固定节点。

  11. HA交还完成后、在Unified Manager中、搜索步骤2中记录的事件ID。

    HA接管触发的事件将显示在事件详细信息页面上。现在、此事件的状态为已废弃、表示此事件已解决。

  12. 在*问题描述 *中、单击受影响卷的名称。

    此时将显示"性能/卷详细信息"页面。在页面底部的事件时间线中、更改事件图标指示Unified Manager检测到HA交还完成的时间。

  13. 选择*细分数据依据*。

  14. 在*延迟*下、选择"集群组件"

    此时将显示"Cluster Components"图表。

  15. 在页面底部、将光标指向HA交还的更改事件图标。

    此更改事件将在Events List表中突出显示、并指示HA交还已成功完成。

  16. 在*集群组件*图表中、将数据处理的延迟与*延迟*图表中的总延迟进行比较。

    数据处理组件的延迟已减少,从而降低了总延迟。选定卷当前用于数据处理的节点已解决此事件。