이상 징후 감지 모니터
이상 징후 탐지를 통해 테넌트의 데이터 패턴이 예기치 않게 변경되는 상황을 파악할 수 있습니다. 예를 들어, 물체의 동작 패턴이 변경될 때 변형이 발생합니다. 예를 들어 물체가 수요일에 특정 시간에 특정 수준의 지연 시간을 경험하지만 그 이후 수요일에 해당 수준보다 지연 시간이 급증하면 이러한 증가는 변형으로 간주됩니다. Data Infrastructure Insights를 사용하면 이와 같은 이상 현상이 발생할 경우 모니터를 생성하여 경고를 표시할 수 있습니다.
이상 징후 탐지는 반복적이고 예측 가능한 패턴을 보이는 개체 메트릭에 적합합니다. 이러한 오브젝트 메트릭이 예상 수준보다 높거나 낮으면 Data Infrastructure Insights에서 알림을 생성하여 빠르게 조사할 수 있습니다.
이상 탐지란 무엇입니까?
이상 현상은 메트릭의 평균 값이 이전 몇 주 동안 해당 메트릭의 가중치 평균에서 벗어난 표준 편차 수일 때 발생하며 최근 몇 주가 이전 주보다 가중치가 더 높은 경우에 발생합니다. Data Infrastructure Insights는 데이터를 모니터링하고 이상 징후가 감지될 경우 경고하는 기능을 제공합니다. 감지의 "감도" 수준을 설정할 수 있습니다. 예를 들어, 평균 값이 평균에서 더 적은 표준 편차가 발생하여 더 많은 알림이 생성되는 경우 감도가 더 높을 수 있습니다. 반대로 민감도가 낮을수록 평균보다 표준 편차가 크면 알림 수가 줄어듭니다.
이상 징후 감지 모니터링은 임계값 모니터링과 다릅니다.
-
* 임계값 기반 모니터링 * 은 특정 메트릭에 대해 사전 정의된 임계값이 있을 때 작동합니다. 즉, 기대되는 바를 명확하게 이해할 수 있는 경우(예: 정상 범위 이내)
-
* 이상 검출 감시 * 는 "정상"의 정의가 명확하지 않은 경우 기계 학습 알고리즘을 사용하여 규범에서 벗어나는 이상치를 식별합니다.
언제 이상 탐지가 필요합니까?
이상 징후 감지 모니터링은 다음과 같은 여러 상황에 대해 유용한 알림을 제공할 수 있습니다.
-
normal_의 정의가 불분명한 경우 예를 들어 SAN 오류율은 포트에 따라 달라질 수 있습니다. 하나의 오류에 대해 경고하는 것은 시끄럽고 불필요하지만 갑작스럽거나 심각한 증가는 광범위한 문제를 나타낼 수 있습니다.
-
시간이 지남에 따라 변화가 있는 곳 계절성이 나타나는 워크로드(즉, 특정 시간에 바쁘거나 조용함) 여기에는 배치 정지를 나타낼 수 있는 예기치 않은 조용한 기간이 포함될 수 있습니다.
-
수동으로 임계값을 정의하고 조정하는 것이 불가능한 대량의 데이터로 작업합니다. 예를 들어, 다양한 워크로드가 있는 많은 호스트 및/또는 볼륨이 있는 테넌트가 있습니다. 각 SLA는 서로 다를 수 있으므로 기준을 초과하는 SLA를 이해하는 것이 중요합니다.
비정상 감지 모니터 만들기
이상 징후를 경고하려면 * 관측성 > 경고 >+모니터 * 로 이동하여 모니터를 생성하십시오. 모니터 유형으로 _비정상 감지 모니터 _ 를 선택합니다.
모니터링할 개체 및 메트릭을 선택합니다. 다른 유형의 모니터와 마찬가지로 필터 및 그룹화를 설정할 수 있습니다.
그런 다음 모니터 조건을 설정합니다.
-
선택한 메트릭이 예측된 경계를 _specks_로, _ 이(가) 해당 경계 아래로 떨어지거나 둘 다 있을 때 알림을 트리거합니다.
-
민감도를 Medium,Low(더 적은 이상 징후가 감지됨) 또는 High(더 많은 이상 징후가 감지됨)로 설정합니다.
-
경고 수준이 _Critical_인지 _Warning_인지 확인합니다.
-
필요한 경우, 아래 값을 설정하여 비정상이 _ 무시되는 _ 을(를) 지정합니다. 이렇게 하면 노이즈를 줄일 수 있습니다. 이 값은 샘플 그래프에서 파선으로 표시됩니다.
마지막으로 알림(이메일, Webhook 또는 둘 다)에 대한 전달 방법을 구성하고, 모니터에 설명 또는 수정 조치를 선택적으로 제공하고, 원하는 경우 모니터를 사용자 지정 그룹에 추가할 수 있습니다.
의미 있는 이름으로 모니터를 저장하면 됩니다.
생성시 모니터는 이전 주의 데이터를 분석하여 초기 기준선을 설정합니다. 시간이 지나고 기록이 많아질수록 이상 탐지가 더 정확해집니다.
이상 징후 보기
경고 랜딩 페이지에서, 이상 징후가 감지될 때 트리거된 경고는 메트릭이 예측 경계를 벗어나는 시점부터 메트릭이 해당 경계 안으로 다시 이동된 시점까지 차트에 강조 표시된 밴드를 표시합니다.
경고 랜딩 페이지에서 이상 징후 차트를 보면서 다음 옵션을 선택할 수 있습니다.
-
Weekly Trend(주간 추세): 값을 이전 주의 동일한 시간과 비교합니다.
-
전체 이상 경계: 기본적으로 그래프는 메트릭 값에 초점을 맞추므로 메트릭 동작을 보다 잘 분석할 수 있습니다. 전체 이상 경계(최대값 등)를 표시하려면 선택합니다.
랜딩 페이지의 전문가 보기에서 해당 개체를 선택하여 이상 징후를 유발한 개체를 볼 수도 있습니다. 선택한 개체의 동작이 차트에 표시됩니다.