简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。
Unified Manager 如何使用工作负载延迟来识别性能问题
工作负载延迟(响应时间)是集群上的卷响应来自客户端应用程序的 I/O 请求所需的时间。 Unified Manager 使用延迟来检测性能事件并向您发出警报。
高延迟意味着应用程序对集群上的卷的请求所花的时间比平时要长。高延迟的原因可能是集群本身,因为一个或多个集群组件存在争用。高延迟也可能由集群外部的问题引起,例如网络瓶颈、托管应用程序的客户端问题或应用程序本身的问题。
|
Unified Manager 仅监控集群上的工作负载活动。它不监控应用程序、客户端或应用程序与集群之间的路径。 |
集群上的操作(例如进行备份或运行重复数据删除)会增加对其他工作负载共享的集群组件的需求,也会导致高延迟。如果实际延迟超过预期范围(延迟预测)的动态性能阈值,Unified Manager 会分析该事件以确定它是否是您可能需要解决的性能事件。延迟以每次操作的毫秒数 (ms/op) 来衡量。
在“工作负载分析”页面的“总延迟”图表上,您可以查看延迟统计数据的分析,以了解各个进程(例如读取和写入请求)的活动与整体延迟统计数据的比较情况。通过比较,您可以确定哪些操作具有最高的活动,或者特定操作是否具有影响卷延迟的异常活动。在分析性能事件时,您可以使用延迟统计数据来确定事件是否由集群上的问题引起。您还可以识别事件中涉及的特定工作负载活动或集群组件。

此示例显示了延迟图表。实际响应时间(延迟)活动为蓝线,延迟预测(预期范围)为绿色。
|
如果 Unified Manager 无法收集数据,蓝线中可能会出现间隙。发生这种情况可能是因为集群或卷无法访问、Unified Manager 在此期间关闭或收集时间超过 5 分钟的收集时间。 |