정족수와 엡실론을 이해하세요
쿼럼과 엡실론은 클러스터의 상태와 기능을 측정하는 중요한 척도이며, 이를 통해 클러스터가 잠재적인 통신 및 연결 문제를 어떻게 해결하는지 알 수 있습니다.
_쿼럼_은 클러스터가 완벽하게 기능하기 위한 전제 조건입니다. 클러스터가 쿼럼에 속하면 노드의 과반수가 정상적이며 서로 통신할 수 있습니다. 쿼럼이 손실되면 클러스터는 정상적인 클러스터 작업을 수행할 수 없게 됩니다. 모든 노드가 집합적으로 데이터에 대한 단일 뷰를 공유하기 때문에 한 번에 하나의 노드 컬렉션만 쿼럼을 가질 수 있습니다. 따라서 통신하지 않는 두 노드가 서로 다른 방식으로 데이터를 수정하도록 허용되면 더 이상 데이터를 단일 데이터 뷰로 조정할 수 없습니다.
클러스터의 각 노드는 하나의 노드 마스터를 선출하는 투표 프로토콜에 참여합니다. 나머지 노드는 모두 보조 노드입니다. 마스터 노드는 클러스터 전체에서 정보를 동기화하는 역할을 합니다. 정족수가 형성되면 지속적인 투표를 통해 유지됩니다. 마스터 노드가 오프라인이 되고 클러스터가 여전히 쿼럼에 있는 경우 온라인 상태를 유지하는 노드에 의해 새 마스터가 선출됩니다.
짝수의 노드가 있는 클러스터에서는 동점이 발생할 가능성이 있으므로, 한 노드는 엡실론이라는 추가적인 분수 투표 가중치를 갖습니다. 대규모 클러스터의 두 개의 동일한 부분 사이의 연결이 끊어지면 epsilon을 포함하는 노드 그룹은 모든 노드가 정상이라고 가정하고 쿼럼을 유지합니다. 예를 들어, 다음 그림은 두 개의 노드에 장애가 발생한 4개 노드 클러스터를 보여줍니다. 그러나 살아남은 노드 중 하나가 엡실론을 보유하고 있기 때문에 건강한 노드의 단순 과반수가 없더라도 클러스터는 정족수를 유지합니다.
클러스터가 생성되면 Epsilon이 자동으로 첫 번째 노드에 할당됩니다. 엡실론을 보유한 노드가 비정상 상태가 되거나, 고가용성 파트너를 인수하거나, 고가용성 파트너에게 인수되는 경우, 엡실론은 다른 HA 쌍의 정상 노드에 자동으로 재할당됩니다.
노드를 오프라인으로 전환하면 클러스터가 쿼럼에 남는 능력에 영향을 미칠 수 있습니다. 따라서 ONTAP 클러스터를 쿼럼에서 제외하거나 쿼럼 손실 직전까지 클러스터를 중단시키는 작업을 시도하는 경우 경고 메시지를 발행합니다. 고급 권한 수준에서 cluster quorum-service options modify 명령을 사용하여 쿼럼 경고 메시지를 비활성화할 수 있습니다.
일반적으로 클러스터 노드 간에 안정적인 연결이 있다고 가정하면, 더 큰 클러스터가 더 작은 클러스터보다 더 안정적입니다. 24개 노드로 구성된 클러스터에서는 절반의 노드와 엡실론의 단순 과반수라는 정족수 요건을 유지하는 것이 2개 노드로 구성된 클러스터보다 쉽습니다.
2노드 클러스터는 쿼럼을 유지하는 데 있어 몇 가지 고유한 과제를 안고 있습니다. 2노드 클러스터는 클러스터 HA를 사용하는데, 여기서는 어느 노드도 엡실론을 보유하지 않습니다. 대신 두 노드가 지속적으로 폴링되어 한 노드가 실패하더라도 다른 노드가 데이터에 대한 전체 읽기-쓰기 액세스 권한과 논리적 인터페이스 및 관리 기능에 대한 액세스 권한을 갖도록 보장합니다.