响应集群不平衡性能事件
当集群中某个节点的负载远高于其他节点时,Unified Manager 会生成集群不平衡警告事件,因此可能会影响工作负载延迟。这些系统定义的事件提供了在许多工作负载受到延迟影响之前纠正潜在性能问题的机会。
您必须具有操作员、应用程序管理员或存储管理员角色。
Unified Manager 通过比较集群中所有节点的性能容量使用值来查看任何节点之间是否存在 30% 的负载差异,从而为集群不平衡阈值策略违规生成警告事件。
这些步骤可帮助您识别以下资源,以便您可以将高性能工作负载移动到利用率较低的节点:
-
同一集群中利用率较低的节点
-
新节点上利用率最低的聚合
-
当前节点上性能最高的卷
-
显示*事件*详细信息页面以查看有关该事件的信息。
-
查看*描述*,其中描述了导致该事件的阈值违规。
例如,消息“
性能容量使用计数器指示集群 Dallas-1-8 上的节点之间的负载差异为 62%,并根据系统阈值 30% 触发了警告事件
”表示其中一个节点上的性能容量被过度使用并影响节点性能。 -
查看“建议的操作”中的文本,将高性能卷从具有高性能容量使用值的节点移动到具有最低性能容量使用值的节点。
-
确定性能容量使用值最高和最低的节点:
-
在“事件信息”部分中,单击源集群的名称。
-
在“集群/性能摘要”页面中,单击“管理对象”区域中的“节点”。
-
在“节点”库存页面中,按“已用性能容量*”列对节点进行排序。
-
确定性能容量使用值最高和最低的节点并记下这些名称。
-
-
确定具有最高性能容量使用值的节点上使用最多 IOPS 的卷:
-
单击性能容量使用值最高的节点。
-
在*节点/性能资源管理器*页面中,从*查看和比较*菜单中选择*此节点上的聚合*。
-
单击具有最高性能容量使用值的聚合。
-
在*聚合/性能资源管理器*页面中,从*查看和比较*菜单中选择*此聚合上的卷*。
-
按 IOPS 列对卷进行排序,并记下使用最多 IOPS 的卷的名称以及该卷所在聚合的名称。
-
-
确定具有最低性能容量使用值的节点上利用率最低的聚合:
-
单击“存储”>“聚合”以显示“聚合”库存页面。
-
选择*性能:所有聚合*视图。
-
单击“过滤器”按钮并添加一个过滤器,其中“
Node
”等于您在步骤 4 中记下的具有最低性能容量使用值的节点的名称。 -
记下具有最低性能容量使用值的聚合的名称。
-
-
将卷从过载节点移动到您确定为在新节点上利用率较低的聚合。
您可以使用ONTAP System Manager、 OnCommand Workflow Automation、 ONTAP命令或这些工具的组合来执行移动操作。
几天后,检查您是否从该集群收到相同的集群不平衡事件。