简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。
Unified Manager 如何确定事件对性能的影响
Unified Manager 使用工作负载的活动、利用率、写入吞吐量、集群组件使用率或 I/O 延迟(响应时间)的偏差来确定对工作负载性能的影响级别。此信息决定了事件中每个工作负载的角色以及它们在事件详细信息页面上的排名方式。
Unified Manager 将工作负载的最后分析值与预期值范围(延迟预测)进行比较。最后分析的值与预期值范围之间的差异可确定受事件影响最大的工作负载。
例如,假设一个集群包含两个工作负载:工作负载 A 和工作负载 B。工作负载 A 的延迟预测为每操作 5-10 毫秒 (ms/op),而其实际延迟通常在 7 ms/op 左右。工作负载 B 的延迟预测为 10-20 ms/op,其实际延迟通常在 15 ms/op 左右。两种工作负载都完全符合其延迟预测。由于集群上的争用,两个工作负载的延迟都增加到 40 ms/op,超过了动态性能阈值(即延迟预测的上限),并触发事件。对于工作负载 A,从预期值到性能阈值以上的值的延迟偏差约为 33 ms/op,而对于工作负载 B,延迟偏差约为 25 ms/op。两种工作负载的延迟都飙升至 40 ms/op,但工作负载 A 对性能的影响更大,因为它的延迟偏差更高,为 33 ms/op。
在“事件详细信息”页面的“系统诊断”部分中,您可以根据集群组件的活动、利用率或吞吐量偏差对工作负载进行排序。您还可以按延迟对工作负载进行排序。当您选择排序选项时,Unified Manager 会分析自检测到事件以来活动、利用率、吞吐量或延迟与预期值的偏差,以确定工作负载排序顺序。对于延迟,红点( ) 表示受害工作负载跨越了性能阈值,以及随后对延迟的影响。每个红点表示延迟的偏差程度较高,这有助于您识别受事件影响最大的延迟受害者工作负载。