响应由 QoS 策略组限制引起的动态性能事件
您可以使用 Unified Manager 调查由服务质量 (QoS) 策略组限制工作负载吞吐量 (MB/s) 所导致的性能事件。限制增加了策略组中卷工作负载的响应时间(延迟)。您可以使用事件信息来确定是否需要对策略组施加新的限制以停止限制。
-
您必须具有操作员、应用程序管理员或存储管理员角色。
-
必须有新的、公认的或过时的绩效事件。
-
显示*活动详情*页面以查看有关活动的信息。
-
阅读*描述*,其中显示受限制影响的工作负载的名称。
描述可以显示受害者和欺凌者的相同工作负载,因为限制使工作负载成为其自身的受害者。
-
使用文本编辑器等应用程序记录卷的名称。
您可以稍后搜索卷名来找到它。
-
在“工作负载延迟”和“工作负载利用率”图表中,选择“Bully Workloads”。
-
将光标悬停在图表上,即可查看影响策略组的主要用户定义工作负载。
列表顶部的工作负载偏差最大,导致发生节流。活动是每个工作负载使用的策略组限制的百分比。
-
在“建议的操作”区域中,单击排名靠前的工作负载的“分析工作负载”按钮。
-
在工作负载分析页面中,设置延迟图表查看所有集群组件,设置吞吐量图表查看细分。
细分图表显示在延迟图表和 IOPS 图表下方。
-
比较*延迟*图表中的 QoS 限制,以查看在事件发生时多少限制量影响了延迟。
QoS 策略组的最大吞吐量为每秒 1,000 个操作 (op/sec),其中的工作负载总和不能超过该吞吐量。事件发生时,策略组中的工作负载的合并吞吐量超过 1,200 操作/秒,这导致策略组将其活动限制回 1,000 操作/秒。
-
将*读取/写入延迟*值与*读取/写入/其他*值进行比较。
两个图表都显示读取请求数量较多且延迟较高,但写入请求的数量和延迟量较低。这些值可帮助您确定是否存在大量吞吐量或大量操作增加了延迟。在决定对吞吐量或操作设置策略组限制时,您可以使用这些值。
-
使用ONTAP系统管理器将策略组的当前限制增加到 1,300 op/sec。
-
一天后,返回 Unified Manager 并在 工作负载分析 页面中输入您在步骤 3 中记录的工作负载。
-
选择吞吐量细分图表。
显示读取/写入/其他图表。
-
在页面顶部,将光标指向更改事件图标 (
) 来更改策略组限制。
-
将*读取/写入/其他*图表与*延迟*图表进行比较。
读写请求相同,但节流已停止,延迟也减少了。