Comprendre le quorum et l'epsilon
Le quorum et l'epsilon sont des mesures importantes de la santé et du fonctionnement des clusters qui, ensemble, indiquent comment les clusters relèvent les défis potentiels en matière de communication et de connectivité.
Quorum est une condition préalable pour un cluster pleinement fonctionnel. Lorsqu'un cluster est en quorum, une simple majorité de nœuds sont sains et peuvent communiquer entre eux. Lorsque le quorum est perdu, le cluster perd la capacité d’accomplir les opérations normales du cluster. Un seul ensemble de nœuds peut avoir le quorum à un moment donné, car tous les nœuds partagent collectivement une vue unique des données. Par conséquent, si deux nœuds non communicants sont autorisés à modifier les données de manière divergente, il n'est plus possible de rapprocher les données dans une vue de données unique.
Chaque nœud du cluster participe à un protocole de vote qui élit un nœud maître ; chaque nœud restant est un nœud secondaire. Le nœud maître est responsable de la synchronisation des informations sur l’ensemble du cluster. Lorsque le quorum est atteint, il est maintenu par un vote continu. Si le nœud maître est hors ligne et que le cluster est toujours en quorum, un nouveau maître est élu par les nœuds qui restent en ligne.
Étant donné qu'il existe un risque d'égalité dans un cluster comportant un nombre pair de nœuds, un nœud possède un poids de vote fractionnaire supplémentaire appelé epsilon. Si la connectivité entre deux parties égales d'un grand cluster échoue, le groupe de nœuds contenant epsilon maintient le quorum, en supposant que tous les nœuds sont sains. Par exemple, l’illustration suivante montre un cluster à quatre nœuds dans lequel deux des nœuds sont tombés en panne. Cependant, comme l’un des nœuds survivants détient epsilon, le cluster reste en quorum même s’il n’y a pas une majorité simple de nœuds sains.
Epsilon est automatiquement attribué au premier nœud lors de la création du cluster. Si le nœud qui contient epsilon devient défectueux, prend le contrôle de son partenaire de haute disponibilité ou est repris par son partenaire de haute disponibilité, alors epsilon est automatiquement réaffecté à un nœud sain dans une autre paire HA.
La mise hors ligne d’un nœud peut affecter la capacité du cluster à rester en quorum. Par conséquent, ONTAP émet un message d'avertissement si vous tentez une opération qui va soit sortir le cluster du quorum, soit le placer à une panne d'une perte de quorum. Vous pouvez désactiver les messages d'avertissement de quorum en utilisant la commande cluster quorum-service options modify au niveau de privilège avancé.
En général, en supposant une connectivité fiable entre les nœuds du cluster, un cluster plus grand est plus stable qu'un cluster plus petit. L'exigence de quorum d'une majorité simple de la moitié des nœuds plus epsilon est plus facile à maintenir dans un cluster de 24 nœuds que dans un cluster de deux nœuds.
Un cluster à deux nœuds présente des défis uniques pour maintenir le quorum. Les clusters à deux nœuds utilisent le cluster HA, dans lequel aucun nœud ne détient d'epsilon ; au lieu de cela, les deux nœuds sont interrogés en permanence pour garantir que si l'un des nœuds tombe en panne, l'autre dispose d'un accès complet en lecture-écriture aux données, ainsi que d'un accès aux interfaces logiques et aux fonctions de gestion.