了解法定人數和 epsilon
Quorum 和 epsilon 是衡量集群健康和功能的重要指標,它們共同表明集群如何應對潛在的通訊和連接挑戰。
Quorum 是叢集完全正常運作的先決條件。當叢集處於法定人數時,大多數節點都是健康的並且可以相互通訊。當仲裁遺失時,集群將失去完成正常集群操作的能力。由於所有節點共同共享單一資料視圖,因此任何時候都只能有一個節點集合具有仲裁。因此,如果允許兩個不通訊的節點以不同的方式修改數據,就不再可能將數據協調到單一數據視圖中。
叢集中的每個節點都參與投票協議,選舉一個節點主節點;其餘每個節點都是輔助節點。主節點負責整個叢集的資訊同步。當法定人數形成後,透過持續投票來維持。如果主節點離線且叢集仍然處於仲裁狀態,則由保持在線的節點選出新的主節點。
由於在具有偶數節點的集群中存在平局的可能性,因此一個節點具有稱為 epsilon 的額外分數投票權重。如果大型群集的兩個相等部分之間的連接失敗,則包含 epsilon 的節點組將維持仲裁,假設所有節點都是健康的。例如,下圖顯示了一個四節點群集,其中兩個節點發生故障。然而,由於其中一個倖存節點擁有 epsilon,因此即使健康節點的數量未達到簡單多數,叢集仍保持法定人數。

建立叢集時,Epsilon 會自動指派到第一個節點。如果持有 epsilon 的節點變得不健康、接管其高可用性夥伴節點或被其高可用性夥伴節點接管,則 epsilon 會自動重新分配到不同 HA 對中的健康節點。
使節點脫機可能會影響叢集保持仲裁的能力。因此,如果您嘗試執行使叢集脫離法定人數或使其因失去法定人數而發生一次中斷的操作,ONTAP會發出警告訊息。您可以在進階權限層級使用 cluster quorum-service options modify 指令停用仲裁警告訊息。
一般來說,假設群集節點之間的連接可靠,則較大的群集比較小的群集較穩定。與 2 個節點的群集相比,在 24 個節點的群集中更容易維持半數節點加 epsilon 的簡單多數的法定人數要求。
雙節點集群對於維持仲裁提出了一些獨特的挑戰。雙節點叢集使用叢集 HA,其中兩個節點都不持有 epsilon;相反,兩個節點都會被持續輪詢,以確保如果一個節點發生故障,另一個節點可以完全讀寫數據,並可以存取邏輯介面和管理功能。