HA 테이크오버 때문에 발생하는 동적 성능 이벤트에 대한 대응
Unified Manager를 사용하면 고가용성(HA) 쌍의 클러스터 노드에서 높은 데이터 처리로 인해 발생하는 성능 이벤트를 조사할 수 있습니다. Unified Manager를 사용하여 노드의 상태를 점검하여 노드에서 감지된 최신 상태 이벤트가 성능 이벤트에 기여했는지 확인할 수도 있습니다.
시작하기 전에
-
운영자, OnCommand 관리자 또는 스토리지 관리자 역할이 있어야 합니다.
-
새로운 성능 이벤트, 확인된 이벤트 또는 사용되지 않는 성능 이벤트가 있어야 합니다.
단계
-
이벤트에 대한 정보를 보려면 * 이벤트 세부 정보 * 페이지를 표시합니다.
-
이벤트와 관련된 워크로드 및 경합의 클러스터 구성 요소에 대해 설명하는 * Description * 을 읽습니다.
경합 중인 클러스터 구성 요소에 의해 지연 시간이 영향을 받은 피해자 볼륨이 한 개 있습니다. 파트너 노드에서 모든 워크로드를 인계받은 데이터 처리 노드는 경합이 발생한 클러스터 구성 요소입니다. Component in Contention(충돌 시 구성 요소) 아래에 데이터 처리 아이콘이 빨간색으로 강조 표시되고 이벤트 시 데이터 처리를 처리하고 있는 노드의 이름이 괄호 안에 표시됩니다.
-
Description * 에서 피해자 볼륨의 이름을 클릭합니다.
성능/볼륨 세부 정보 페이지가 표시됩니다. 페이지 하단의 이벤트 시간 줄에 변경 이벤트 아이콘()은 Unified Manager가 HA 테이크오버 시작을 감지한 시간을 나타냅니다.
-
HA 테이크오버 이벤트 변경 아이콘에 커서를 놓습니다.
HA 테이크오버 관련 세부 정보가 이벤트 목록 표에 표시됩니다. 지연 시간 차트에서 이벤트는 HA 테이크오버 시간과 거의 동일한 시간의 높은 지연 시간으로 인해 선택한 볼륨이 성능 임계값을 초과했음을 나타냅니다.
-
데이터 분리 기준 * 을 선택합니다.
-
지연 시간 * 아래에서 * 클러스터 구성 요소 * 를 선택합니다.
-
제출 * 을 클릭합니다.
클러스터 구성 요소 차트가 표시됩니다. 이 차트는 클러스터 구성 요소별 총 지연 시간을 보여 줍니다.
-
페이지 아래쪽에서 HA 테이크오버 시작에 대한 변경 이벤트 아이콘을 마우스 커서로 가리킵니다.
-
클러스터 구성 요소 * 차트에서 데이터 처리 지연 시간을 * 지연 시간 * 차트의 총 지연 시간과 비교합니다.
HA 테이크오버 중 데이터 처리 노드의 워크로드 수요 증가로 데이터 처리가 급증했습니다. CPU 활용률이 증가하면서 지연 시간이 늘어나고 이벤트가 트리거되었습니다.
-
장애가 발생한 노드를 해결한 후 OnCommand System Manager를 사용하여 HA 기브백을 수행하여 워크로드를 파트너 노드에서 고정 노드로 이동합니다.
-
HA 반환이 완료된 후 Unified Manager에서 2단계에서 기록한 이벤트 ID를 검색합니다.
HA 테이크오버 발생하면 이벤트 세부 정보 페이지에 이벤트가 표시됩니다. 이벤트에 이제 사용되지 않는 상태가 있습니다. 이는 이벤트가 해결되었음을 나타냅니다.
-
Description * 에서 피해자 볼륨의 이름을 클릭합니다.
성능/볼륨 세부 정보 페이지가 표시됩니다. 페이지 하단의 이벤트 시간 줄에 있는 변경 이벤트 아이콘은 Unified Manager가 HA 기브백의 완료를 감지한 시간을 나타냅니다.
-
데이터 분리 기준 * 을 선택합니다.
-
지연 시간 * 아래에서 * 클러스터 구성 요소 * 를 선택합니다.
클러스터 구성 요소 차트가 표시됩니다.
-
페이지 아래쪽에서 HA 반환에 대한 변경 이벤트 아이콘에 커서를 놓습니다.
변경 이벤트가 이벤트 목록 테이블에서 강조 표시되고 HA 반환이 성공적으로 완료되었음을 나타냅니다.
-
클러스터 구성 요소 * 차트에서 데이터 처리 지연 시간을 * 지연 시간 * 차트의 총 지연 시간과 비교합니다.
데이터 처리 구성 요소의 지연 시간이 감소되어 총 지연 시간이 감소했습니다. 선택한 볼륨이 현재 데이터 처리에 사용 중인 노드에서 이벤트를 해결했습니다.