디스크 장애로 인한 동적 성능 이벤트에 대한 응답
Unified Manager를 사용하면 애그리게이트를 과도하게 활용하여 워크로드가 발생하는 성능 이벤트를 조사할 수 있습니다. 또한 Unified Manager를 사용하여 애그리게이트의 상태를 점검하여 성능 이벤트가 발생한 애그리게이트에서 감지된 최신 상태 이벤트가 있는지 확인할 수 있습니다.
시작하기 전에
-
운영자, OnCommand 관리자 또는 스토리지 관리자 역할이 있어야 합니다.
-
새로운 성능 이벤트, 확인된 이벤트 또는 사용되지 않는 성능 이벤트가 있어야 합니다.
단계
-
이벤트에 대한 정보를 보려면 * 이벤트 세부 정보 * 페이지를 표시합니다.
-
이벤트와 관련된 워크로드 및 경합의 클러스터 구성 요소에 대해 설명하는 * Description * 을 읽습니다.
경합 중인 클러스터 구성 요소의 지연 시간에 영향을 받은 여러 개의 대상 볼륨이 있습니다. RAID 재구성 중에 장애가 발생한 디스크를 스페어 디스크로 교체하기 위한 애그리게이트는 경합 중인 클러스터 구성요소입니다. 경합의 부품 아래에서 집계 아이콘이 빨간색으로 강조 표시되고 집계 이름이 괄호 안에 표시됩니다.
-
워크로드 활용률 차트에서 * Bully Workload * 를 선택합니다.
-
차트 위에 커서를 올려 놓으면 구성 요소에 영향을 주는 상위 워크로드가 표시됩니다.
이벤트가 감지된 이후 최고 사용률이 가장 높은 상위 워크로드가 차트 상단에 표시됩니다. 가장 중요한 워크로드 중 하나는 RAID 재구성을 나타내는 시스템 정의 워크로드 디스크 상태 입니다. 재구성은 스페어 디스크로 애그리게이트를 재구성하는 작업과 관련된 내부 프로세스입니다. 디스크 상태 워크로드와 애그리게이트의 기타 워크로드가 서로 경합하면 애그리게이트와 관련 이벤트가 발생할 수 있습니다.
-
디스크 상태 워크로드의 작업으로 인해 이벤트가 발생했는지 확인한 후 재구성이 완료될 때까지 약 30분 정도 기다린 후 Unified Manager가 이벤트를 분석하고 애그리게이션 경합이 아직 지속되는지 여부를 감지할 수 있도록 합니다.
-
Unified Manager에서 2단계에서 기록한 이벤트 ID를 검색합니다.
디스크 오류에 대한 이벤트가 이벤트 세부 정보 페이지에 표시됩니다. RAID 재구성이 완료된 후 상태가 폐기되어 이벤트가 해결되었음을 나타내는지 확인합니다.
-
워크로드 활용률 차트에서 * Bully Workload * 를 선택하여 최대 활용률별 총 워크로드를 봅니다.
-
상위 워크로드의 * Performance/Volume Details * 페이지로 이동합니다.
-
1d * 를 클릭하여 선택한 볼륨에 대한 마지막 24시간(1일)의 데이터를 표시합니다.
지연 시간 차트에서 빨간색 점()는 디스크 오류 이벤트가 발생한 시기를 나타냅니다.
-
데이터 분리 기준 * 을 선택합니다.
-
구성 요소 * 에서 * 디스크 사용률 * 을 선택합니다.
-
제출 * 을 클릭합니다.
디스크 활용률 차트에는 선택한 워크로드에서 대상 애그리게이트의 디스크로 전송되는 모든 읽기 및 쓰기 요청의 그래프가 표시됩니다.
-
디스크 사용률 * 차트의 데이터를 * 지연 시간 * 차트의 이벤트 시점의 데이터와 비교합니다.
이벤트 발생 시 디스크 활용률은 RAID 재구성 프로세스로 인해 발생하는 많은 양의 읽기 및 쓰기 작업을 보여주며, 이로 인해 선택한 볼륨의 지연 시간이 증가합니다. 이벤트가 발생한 후 몇 시간이 지나면 읽기 및 쓰기와 지연 시간이 모두 감소되어 애그리게이트는 더 이상 경합이 발생하지 않음을 확인합니다.