集群组件及其争用的原因
当集群组件发生争用时,您可以识别集群性能问题。使用该组件的工作负载的性能会变慢,并且其对客户端请求的响应时间(延迟)会增加,从而触发 Unified Manager 中的事件。
存在争用的组件无法达到最佳性能。它的性能已经下降,并且其他集群组件和工作负载(称为“受害者”)的性能可能会增加延迟。要使组件摆脱争用,必须减少其工作负载或提高其处理更多工作的能力,以便性能恢复到正常水平。由于 Unified Manager 以五分钟为间隔收集和分析工作负载性能,因此它仅检测集群组件何时持续过度使用。未检测到在五分钟间隔内仅持续很短时间的过度使用瞬态峰值。
例如,存储聚合可能处于争用状态,因为其上的一个或多个工作负载正在竞争满足其 I/O 请求。聚合上的其他工作负载可能会受到影响,导致其性能下降。为了减少聚合上的活动量,您可以采取不同的步骤,例如将一个或多个工作负载移动到不太繁忙的聚合或节点,以减少当前聚合上的总体工作负载需求。对于 QoS 策略组,您可以调整吞吐量限制,或将工作负载移至其他策略组,这样工作负载就不会再受到限制。
Unified Manager 监控以下集群组件,并在它们发生争用时提醒您:
-
网络
表示集群上外部网络协议的 I/O 请求的等待时间。等待时间是指集群响应 I/O 请求之前等待“传输就绪”事务完成所花费的时间。如果网络组件处于争用状态,则意味着协议层的高等待时间会影响一个或多个工作负载的延迟。
-
网络处理
表示集群中涉及协议层和集群之间的 I/O 处理的软件组件。负责网络处理的节点可能会在检测到事件后发生更改。如果网络处理组件存在争用,则意味着网络处理节点的高利用率正在影响一个或多个工作负载的延迟。
在主动-主动配置中使用全 SAN 阵列群集时,将显示两个节点的网络处理延迟值,以便您可以验证节点是否平等地共享负载。
-
QoS 限制最大值
表示分配给工作负载的存储服务质量 (QoS) 策略组的最大吞吐量(峰值)设置。如果策略组组件存在争用,则意味着策略组中的所有工作负载都受到设置的吞吐量限制的限制,这会影响其中一个或多个工作负载的延迟。
-
QoS 限制最小值
表示由分配给其他工作负载的 QoS 吞吐量最小(预期)设置导致的工作负载延迟。如果某些工作负载上设置的 QoS 最小值使用大部分带宽来保证承诺的吞吐量,则其他工作负载将受到限制并出现更多延迟。
-
集群互连
表示集群节点物理连接的电缆和适配器。如果集群互连组件处于争用状态,则意味着集群互连处 I/O 请求的等待时间过长会影响一个或多个工作负载的延迟。
-
Data Processing
表示集群中涉及集群与包含工作负载的存储聚合之间的 I/O 处理的软件组件。负责数据处理的节点可能会在检测到事件后发生更改。如果数据处理组件存在争用,则意味着数据处理节点的高利用率正在影响一个或多个工作负载的延迟。
-
音量激活
表示跟踪所有活动卷使用情况的进程。在有超过 1000 个卷处于活动状态的大型环境中,此过程会跟踪有多少个关键卷需要同时通过节点访问资源。当并发活动卷的数量超过建议的最大阈值时,一些非关键卷将会出现此处标识的延迟。
-
* MetroCluster资源*
表示MetroCluster资源,包括NVRAM和交换机间链路 (ISL),用于在MetroCluster配置中的集群之间镜像数据。如果MetroCluster组件存在争用,则意味着本地集群上的工作负载的高写入吞吐量或链路健康问题正在影响本地集群上一个或多个工作负载的延迟。如果集群不在MetroCluster配置中,则不会显示此图标。
-
聚合或 SSD 聚合操作
表示运行工作负载的存储聚合。如果聚合组件存在争用,则意味着聚合的高利用率正在影响一个或多个工作负载的延迟。聚合由所有 HDD 组成,或由 HDD 和 SSD 的混合(Flash Pool 聚合)组成,或由 HDD 和云层的混合( FabricPool聚合)组成。 “SSD 聚合”由所有 SSD(全闪存聚合)或 SSD 和云层( FabricPool聚合)的混合组成。
-
云延迟
表示集群中涉及集群和存储用户数据的云层之间的 I/O 处理的软件组件。如果云延迟组件存在争用,则意味着托管在云层上的卷的大量读取会影响一个或多个工作负载的延迟。
-
同步SnapMirror
表示集群中涉及在SnapMirror同步关系中将用户数据从主卷复制到辅助卷的软件组件。如果同步SnapMirror组件存在争用,则意味着SnapMirror同步操作的活动正在影响一个或多个工作负载的延迟。