响应由磁盘故障引起的动态性能事件
您可以使用 Unified Manager 调查由工作负载过度利用聚合所导致的性能事件。您还可以使用 Unified Manager 检查聚合的运行状况,以查看在聚合上检测到的近期运行状况事件是否导致了性能事件。
-
您必须具有操作员、应用程序管理员或存储管理员角色。
-
必须有新的、公认的或过时的绩效事件。
-
显示*活动详情*页面以查看有关活动的信息。
-
阅读*描述*,其中描述了事件所涉及的工作负载和争用的集群组件。
有多个受害卷的延迟受到争用中的集群组件的影响。聚合体处于 RAID 重建过程中,用备用磁盘替换故障磁盘,是处于争用的集群组件。在“争用中的组件”下,“聚合”图标以红色突出显示,并且聚合的名称显示在括号中。
-
在工作负载利用率图表中,选择 Bully Workloads。
-
将光标悬停在图表上,可以查看影响该组件的主要工作负载。
自检测到事件以来峰值利用率最高的工作负载显示在图表顶部。最重要的工作负载之一是系统定义的工作负载磁盘健康,它表示 RAID 重建。重建是使用备用磁盘重建聚合所涉及的内部过程。磁盘运行状况工作负载以及聚合上的其他工作负载可能会导致聚合上的争用和相关事件。
-
确认磁盘运行状况工作负载的活动导致该事件后,等待大约 30 分钟以完成重建,并等待 Unified Manager 分析该事件并检测聚合是否仍处于争用状态。
-
刷新*活动详情*。
RAID重建完成后,查看State为obsolete,表示事件已解决。
-
在“工作负载利用率”图表中,选择“Bully Workloads”以按峰值利用率查看聚合上的工作负载。
-
在“建议的操作”区域中,单击排名靠前的工作负载的“分析工作负载”按钮。
-
在“工作负载分析”页面中,设置时间范围以显示所选卷的过去 24 小时(1 天)的数据。
在事件时间轴中,红点(
) 表示磁盘故障事件发生的时间。
-
在节点和聚合利用率图表中,隐藏节点统计线,以便仅保留聚合线。
-
将此图表中的数据与*延迟*图表中事件发生时的数据进行比较。
事件发生时,聚合利用率显示大量读写活动,这是由 RAID 重建过程引起的,这增加了所选卷的延迟。事件发生几个小时后,读写和延迟均有所减少,证实聚合不再存在争用。