响应因 QoS 策略组限制而导致的动态性能事件
您可以使用 Unified Manager 调查因服务质量( QoS )策略组限制工作负载吞吐量( MB/ 秒)而导致的性能事件。限制增加了策略组中卷工作负载的响应时间(延迟)。您可以使用事件信息确定是否需要对策略组设置新的限制来停止限制。
开始之前
-
您必须具有操作员,应用程序管理员或存储管理员角色。
-
必须存在新的,已确认的或已废弃的性能事件。
步骤
-
显示 * 事件详细信息 * 页面以查看有关事件的信息。
-
请阅读 * 问题描述 * ,其中显示了受限制影响的工作负载的名称。
问题描述可以为受影响和抢占资源的用户显示相同的工作负载,因为限制会使工作负载本身受到影响。
-
使用文本编辑器等应用程序记录卷的名称。
您可以稍后搜索卷名称以查找它。
-
在工作负载延迟和工作负载利用率图表中,选择 * 大量工作负载 * 。
-
将光标悬停在图表上方可查看影响策略组的前几个用户定义工作负载。
列表顶部的工作负载的偏差最高,并导致发生限制。活动是指每个工作负载所使用的策略组限制的百分比。
-
在 * 建议操作 * 区域中,单击顶部工作负载的 * 分析工作负载 * 按钮。
-
在*工作负载分析*页面中、设置"延迟"图表以查看所有集群组件、设置"吞吐量"图表以查看细分情况。
细分图表显示在延迟图表和 IOPS 图表下。
-
比较 * 延迟 * 图表中的 QoS 限制,查看事件发生时影响延迟的限制量。
QoS 策略组的最大吞吐量为每秒 1 , 000 次操作(操作 / 秒),其中的工作负载总数不能超过此值。在发生事件时,策略组中的工作负载的总吞吐量超过 1 , 200 次操作 / 秒,从而导致策略组将其活动限制回 1 , 000 次操作 / 秒
-
将 * 读取 / 写入延迟 * 值与 * 读取 / 写入 / 其他 * 值进行比较。
这两个图表都显示大量延迟较高的读取请求,但写入请求的数量和延迟较低。这些值可帮助您确定是否存在导致延迟增加的大量吞吐量或操作数。在决定对吞吐量或操作设置策略组限制时,可以使用这些值。
-
使用 ONTAP 系统管理器将策略组的当前限制增加到 1 , 300 次操作 / 秒
-
一天后,返回 Unified Manager 并在 * 工作负载分析 * 页面中输入步骤 3 中记录的工作负载。
-
选择吞吐量细分图表。
此时将显示读取 / 写入 / 其他图表。
-
在页面顶部,将光标指向更改事件图标()。
-
将 * 读取 / 写入 / 其他 * 图表与 * 延迟 * 图表进行比较。
读取和写入请求相同,但限制已停止,延迟已减少。