HA 테이크오버 때문에 발생하는 동적 성능 이벤트에 대한 대응
Unified Manager를 사용하면 고가용성(HA) 쌍의 클러스터 노드에서 높은 데이터 처리로 인해 발생하는 성능 이벤트를 조사할 수 있습니다. Unified Manager를 사용하여 노드의 상태를 점검하여 노드에서 감지된 최신 상태 이벤트가 성능 이벤트에 기여했는지 확인할 수도 있습니다.
-
필요한 것 *
-
운영자, 애플리케이션 관리자 또는 스토리지 관리자 역할이 있어야 합니다.
-
새로운 성능 이벤트, 확인된 이벤트 또는 사용되지 않는 성능 이벤트가 있어야 합니다.
-
이벤트에 대한 정보를 보려면 * 이벤트 세부 정보 * 페이지를 표시합니다.
-
이벤트와 관련된 워크로드 및 경합의 클러스터 구성 요소에 대해 설명하는 * Description * 을 읽습니다.
경합 중인 클러스터 구성 요소에 의해 지연 시간이 영향을 받은 피해자 볼륨이 한 개 있습니다. 파트너 노드에서 모든 워크로드를 인계받은 데이터 처리 노드는 경합이 발생한 클러스터 구성 요소입니다. Component in Contention(충돌 시 구성 요소) 아래에 데이터 처리 아이콘이 빨간색으로 강조 표시되고 이벤트 시 데이터 처리를 처리하고 있는 노드의 이름이 괄호 안에 표시됩니다.
-
설명 * 에서 볼륨의 이름을 클릭합니다.
볼륨 성능 탐색기 페이지가 표시됩니다. 페이지 위쪽의 이벤트 시간 줄에서 변경 이벤트 아이콘()은 Unified Manager가 HA 테이크오버 시작을 감지한 시간을 나타냅니다.
-
HA 테이크오버 이벤트 변경 아이콘에 커서를 가져가면 HA 테이크오버 관련 세부 정보가 호버 텍스트로 표시됩니다.
지연 시간 차트에서 이벤트는 HA 테이크오버 시간과 거의 동일한 시간의 높은 지연 시간으로 인해 선택한 볼륨이 성능 임계값을 초과했음을 나타냅니다.
-
새 페이지에 지연 시간 차트를 표시하려면 * 확대/축소 보기 * 를 클릭합니다.
-
보기 메뉴에서 * 클러스터 구성 요소 * 를 선택하여 클러스터 구성 요소별 총 지연 시간을 확인합니다.
-
HA 테이크오버 시작을 위한 변경 이벤트 아이콘에 마우스 커서를 놓고 데이터 처리 지연 시간을 총 지연 시간과 비교하십시오.
HA 테이크오버 중 데이터 처리 노드의 워크로드 수요 증가로 데이터 처리가 급증했습니다. CPU 활용률이 증가하면서 지연 시간이 늘어나고 이벤트가 트리거되었습니다.
-
장애가 발생한 노드를 해결한 후 ONTAP System Manager를 사용하여 HA 기브백을 수행하여 워크로드를 파트너 노드에서 고정 노드로 이동합니다.
-
HA 기브백이 완료된 후 Unified Manager에서 다음 구성 검색(약 15분)을 수행한 후 * 이벤트 관리 * 인벤토리 페이지에서 HA 테이크오버(HA)에 의해 트리거되는 이벤트 및 워크로드를 찾습니다.
이제 HA 테이크오버에 의해 트리거된 이벤트에 대해 사용되지 않는 상태가 있으며 이는 이벤트가 해결되었음을 나타냅니다. 데이터 처리 구성 요소의 지연 시간이 감소되어 총 지연 시간이 감소했습니다. 선택한 볼륨이 현재 데이터 처리에 사용 중인 노드에서 이벤트를 해결했습니다.