Tiebreaker 软件如何检测站点故障

NetApp MetroCluster Tiebreaker 软件可检查 MetroCluster 配置和集群中节点的可访问性,以确定是否发生了站点故障。此外,在某些情况下,Tiebreaker 软件还会触发警报。

Tiebreaker 软件监控的组件

Tiebreaker 软件可以为 IP 网络上托管的节点管理 LIF 和集群管理 LIF 提供多条路径以建立冗余连接,以便监控 MetroCluster 配置中的每个控制器。

Tiebreaker 软件会监控 MetroCluster 配置中的以下组件:

如果 Tiebreaker 软件与集群中的所有节点断开连接并与集群本身断开连接,则 Tiebreaker 软件会将该集群视为“无法访问”。检测到连接失败大约需要三到五秒。如果无法从 Tiebreaker 软件访问某个集群,则运行正常的集群(即仍可访问的集群)必须指示与配对集群的所有链路都已切断,然后 Tiebreaker 软件才会触发警报。

注:如果运行正常的集群无法再通过 FC(NV 互连和存储)以及集群间对等与灾难站点上的集群进行通信,则表示所有链路都已切断。

Tiebreaker 软件触发警报的故障情形

如果灾难站点上的集群(所有节点)已关闭或无法访问,而运行正常的站点上的集群指示“AllLinksSevered”状态,则 Tiebreaker 软件将触发警报。

在以下情形中,Tiebreaker 软件不会触发警报(或者警报会被否决):