모니터를 통한 경고
모니터를 생성하여 네트워크 리소스와 관련된 문제를 알리기 위해 알림을 트리거하는 임계값을 설정합니다. 예를 들어, 다양한 프로토콜에 대해 _ node write latency _ 에 대해 경고하는 모니터를 생성할 수 있습니다.
모니터 및 경고는 모든 Data Infrastructure Insights 에디션에서 사용할 수 있지만 Basic Edition에는 다음 사항이 적용됩니다. * 한 번에 최대 5개의 사용자 지정 모니터만 활성화할 수 있습니다. 5개 이상의 모니터는 에서 생성되거나 _Paused_state로 이동됩니다. * VMDK, 가상 머신, 호스트 및 데이터 저장소 메트릭 모니터는 지원되지 않습니다. 이러한 메트릭에 대해 생성된 모니터가 있는 경우 일시 중지되고 Basic Edition으로 다운그레이드할 때 다시 시작할 수 없습니다. |
모니터를 사용하면 스토리지, VM, EC2 및 포트와 같은 "인프라" 객체에서 생성되는 메트릭과 Kubernetes, ONTAP 고급 메트릭, Teleraf 플러그인과 같이 "통합" 데이터에 대한 임계값을 설정할 수 있습니다. 이러한 _metric_monitor는 경고 수준 또는 위험 수준 임계값을 초과할 때 사용자에게 경고합니다.
또한 지정된_log events_가 감지되면 경고를 트리거하는 모니터를 생성할 수도 있습니다.
Data Infrastructure Insights는 귀사의 환경에 다양한 솔루션을 "시스템 정의 모니터"제공합니다.
보안 모범 사례
Data Infrastructure Insights 경고는 사용자 환경의 데이터 포인트와 추세를 강조하도록 설계되었으며, Data Infrastructure Insights를 사용하면 유효한 이메일 주소를 경고 수신자로 입력할 수 있습니다. 보안 환경에서 작업하는 경우 알림을 받는 사람 또는 알림에 액세스할 수 있는 사람을 특히 주의하십시오.
메트릭 또는 로그 모니터?
-
Data Infrastructure Insights 메뉴에서 * Alerts > Manage Monitors * 를 클릭합니다
모니터 목록 페이지가 표시되고 현재 구성된 모니터가 표시됩니다.
-
기존 모니터를 수정하려면 목록에서 모니터 이름을 클릭합니다.
-
모니터를 추가하려면 * + Monitor * 를 클릭합니다.
새 모니터를 추가하면 메트릭 모니터 또는 로그 모니터를 생성하라는 메시지가 표시됩니다.
-
_Metric_monitor 인프라스트럭처 또는 성능 관련 트리거에 대한 경고
-
_Log_는 로그 관련 작업에 대한 경고를 모니터링합니다
모니터 유형을 선택하면 모니터 구성 대화 상자가 표시됩니다. 구성은 생성 중인 모니터 유형에 따라 다릅니다.
-
메트릭 모니터
-
드롭다운에서 모니터링할 객체 유형 및 메트릭을 검색하고 선택합니다.
모니터링할 객체 속성 또는 메트릭을 좁히도록 필터를 설정할 수 있습니다.
통합 데이터(Kubernetes, ONTAP 고급 데이터 등)를 사용할 경우, 메트릭 필터링은 필터가 데이터 시리즈의 집계 값에 대해 작동하고 잠재적으로 전체 오브젝트를 차트에서 제거할 수 있는 인프라 데이터(스토리지, VM, 포트 등)와 달리 표시된 데이터 시리즈에서 개별/일치하지 않는 데이터 요소를 제거합니다.
다중 조건 모니터(예: IOPS > X 및 지연 시간 > Y)를 생성하려면 첫 번째 조건을 임계값으로 정의하고 두 번째 조건을 필터로 정의합니다. |
모니터의 조건을 정의합니다.
-
모니터링할 개체 및 메트릭을 선택한 후 경고 수준 및/또는 위험 수준 임계값을 설정합니다.
-
Warning_level의 경우 예에서는 200을 입력합니다. 이 경고 수준을 나타내는 파선이 예제 그래프에 표시됩니다.
-
Critical_level의 경우 400을 입력합니다. 이 요주의 수준을 나타내는 점선이 예제 그래프에 표시됩니다.
그래프에는 기록 데이터가 표시됩니다. 그래프의 경고 및 위험 수준 선은 모니터의 시각적 표시이므로 각 경우에 모니터가 경고를 트리거할 수 있는 시점을 쉽게 확인할 수 있습니다.
-
발생 간격에 대해 15분 동안 _Continuously_를 선택하십시오.
임계값이 위반될 때 알림을 트리거하거나 임계값이 일정 기간 동안 연속 위반이 될 때까지 대기하도록 선택할 수 있습니다. 이 예에서는 총 IOPS 피크가 경고 또는 위험 수준보다 높을 때마다 알림을 받지 않고 모니터링된 개체가 적어도 15분 동안 이러한 수준 중 하나를 지속적으로 초과할 때만 경고를 받고 싶습니다.
경고 해결 동작을 정의합니다
메트릭 모니터 경고 해결 방법을 선택할 수 있습니다. 두 가지 선택 사항이 제시됩니다.
-
메트릭이 허용 가능한 범위로 돌아오면 해결합니다.
-
메트릭이 1분에서 7일 사이의 지정된 시간 동안 허용 가능한 범위 내에 있을 때 해결합니다.
로그 모니터
로그 모니터 * 를 만들 때는 먼저 사용 가능한 로그 목록에서 모니터링할 로그를 선택합니다. 그런 다음 위와 같이 사용 가능한 속성을 기준으로 필터링할 수 있습니다. 하나 이상의 "그룹화 기준" 속성을 선택할 수도 있습니다.
로그 모니터 필터는 비워 둘 수 없습니다. |
경고 동작을 정의합니다
위에서 정의한 조건이 한 번(즉, 즉시) 발생할 때 심각도 수준이 Critical, Warning 또는 _Informational_인 경우 경고를 표시하거나 조건이 두 번 이상 발생할 때까지 경고를 보내도록 모니터를 만들 수 있습니다.
경고 해결 동작을 정의합니다
로그 모니터 알림의 해결 방법을 선택할 수 있습니다. 세 가지 선택 사항이 있습니다.
-
즉시 해결 *: 추가 조치 없이 즉시 경고가 해결됩니다
-
* 시간 기준 해결 *: 지정된 시간이 경과한 후 경고가 해결됩니다
-
* 로그 항목에 따라 해결 *: 후속 로그 작업이 발생하면 경고가 해결됩니다. 예를 들어, 개체가 "사용 가능"으로 기록된 경우
이상 징후 감지 모니터
-
드롭다운에서 모니터링할 객체 유형 및 메트릭을 검색하고 선택합니다.
모니터링할 객체 속성 또는 메트릭을 좁히도록 필터를 설정할 수 있습니다.
모니터의 조건을 정의합니다.
-
모니터링할 개체 및 메트릭을 선택한 후 이상이 감지된 조건을 설정합니다.
-
선택한 메트릭 * 이 예측 경계를 넘어 * 스파이크하거나 * 이 해당 경계 아래로 떨어지거나 * 스파이크가 경계 위로 또는 아래로 떨어질 때 이상 징후를 감지할지 여부를 선택합니다.
-
감지의 * 감도 * 를 설정합니다. * 낮음 * (더 적은 이상 징후를 감지함), * 보통 * 또는 * 높음 * (더 많은 이상 징후를 감지함).
-
경고를 기타 * 경고 * 또는 * 위험 * 으로 설정합니다.
-
원하는 경우 선택한 메트릭이 설정된 임계값 미만일 때 이상 징후를 무시하면서 노이즈를 줄이도록 선택할 수 있습니다.
-
알림 유형 및 수신자를 선택합니다
팀 알림 설정 _ 섹션에서 전자 메일 또는 Webhook를 통해 팀에 알리도록 선택할 수 있습니다.
-
이메일을 통한 경고: *
알림 알림을 받을 e-메일 수신자를 지정합니다. 필요한 경우 경고 또는 위험 경고에 대해 다른 수신자를 선택할 수 있습니다.
-
Webhook를 통해 알림: *
알림 알림에 사용할 웹 후크를 지정합니다. 필요한 경우 경고 또는 위험 경고에 대해 다른 Webhook을 선택할 수 있습니다.
ONTAP 데이터 수집기 알림은 클러스터/데이터 수집기와 관련된 특정 모니터 알림보다 우선합니다. Data Collector 자체에 대해 설정한 받는 사람 목록에는 데이터 수집기 경고가 표시됩니다. 활성 데이터 수집기 경고가 없는 경우 모니터에서 생성된 알림이 특정 모니터 수신자에게 전송됩니다. |
시정 조치 또는 추가 정보 설정
추가 정보 및/또는 수정 조치는 * 경고 설명 추가 * 섹션을 작성하여 추가할 수 있습니다. 설명은 최대 1024자까지 가능하며 경고와 함께 전송됩니다. 인사이트/수정 조치 필드는 최대 67,000자까지 가능하며 알림 랜딩 페이지의 요약 섹션에 표시됩니다.
이러한 필드에서는 경고를 수정하거나 해결하는 데 필요한 메모, 링크 또는 단계를 제공할 수 있습니다.
모니터를 저장합니다
-
필요한 경우 모니터에 대한 설명을 추가할 수 있습니다.
-
모니터에 의미 있는 이름을 지정하고 * 저장 * 을 클릭합니다.
새 모니터가 활성 모니터 목록에 추가됩니다.
모니터 목록
모니터 페이지에는 현재 구성된 모니터가 나열되며 다음과 같은 정보가 표시됩니다.
-
모니터 이름
-
상태
-
객체/메트릭이 모니터링되고 있습니다
-
모니터 상태
모니터 오른쪽에 있는 메뉴를 클릭하고 * Pause * (일시 중지 *)를 선택하여 개체 유형의 모니터링을 일시적으로 일시 중지할 수 있습니다. 모니터링을 다시 시작할 준비가 되면 * Resume * (재개 *)을 클릭합니다.
메뉴에서 * 복제 * 를 선택하여 모니터를 복사할 수 있습니다. 그런 다음 새 모니터를 수정하고 객체/메트릭, 필터, 조건, 이메일 수신자 등을 변경할 수 있습니다
모니터가 더 이상 필요하지 않은 경우 메뉴에서 * Delete * 를 선택하여 삭제할 수 있습니다.
모니터 그룹
그룹화를 사용하면 관련 모니터를 보고 관리할 수 있습니다. 예를 들어 사용자 환경의 스토리지 전용 모니터 그룹을 사용하거나 특정 수신자 목록과 관련된 모니터를 사용할 수 있습니다.
다음과 같은 모니터 그룹이 표시됩니다. 그룹에 포함된 모니터 수가 그룹 이름 옆에 표시됩니다.
-
* 모든 모니터 * 는 모든 모니터를 나열합니다.
-
* 사용자 지정 모니터 * 는 사용자가 생성한 모든 모니터를 나열합니다.
-
* 일시 중단된 모니터 * 는 Data Infrastructure Insights에 의해 일시 중단된 시스템 모니터를 나열합니다.
-
또한 데이터 인프라 통찰력에는 "시스템 정의 모니터"ONTAP 인프라 및 워크로드 모니터를 포함하여 하나 이상의 그룹이 나열되는 다수의 * 시스템 모니터 그룹 * 이 표시됩니다.
사용자 지정 모니터는 일시 중지, 재개, 삭제 또는 다른 그룹으로 이동할 수 있습니다. 시스템 정의 모니터는 일시 중지 및 재개할 수 있지만 삭제하거나 이동할 수는 없습니다. |
일시 중지된 모니터
이 그룹은 Data Infrastructure Insights가 하나 이상의 모니터를 일시 중단한 경우에만 표시됩니다. 과도한 또는 지속적인 경고를 생성하는 경우 모니터가 일시 중단될 수 있습니다. 모니터가 사용자 지정 모니터인 경우 상태를 변경하여 연속 경고를 방지한 다음 모니터를 다시 시작합니다. 서스펜션의 원인이 되는 문제가 해결되면 모니터가 Suspended Monitors 그룹에서 제거됩니다.
시스템 정의 모니터
사용자 환경에 모니터에 필요한 장치 및/또는 로그 가용성이 포함되어 있는 경우 이러한 그룹은 Data Infrastructure Insights에서 제공하는 모니터를 표시합니다.
시스템 정의 모니터는 수정하거나 다른 그룹으로 이동하거나 삭제할 수 없습니다. 그러나 시스템 모니터를 복제하고 복제본을 수정하거나 이동할 수 있습니다.
시스템 모니터에는 ONTAP 인프라(스토리지, 볼륨 등) 또는 워크로드(예: 로그 모니터) 또는 기타 그룹의 모니터가 포함될 수 있습니다. NetApp은 고객의 필요와 제품 기능을 지속적으로 평가하고 있으며 필요에 따라 시스템 모니터 및 그룹을 업데이트하거나 추가합니다.
사용자 지정 모니터 그룹
필요에 따라 모니터를 포함할 그룹을 직접 만들 수 있습니다. 예를 들어 모든 스토리지 관련 모니터에 대해 그룹을 설정할 수 있습니다.
새 사용자 정의 모니터 그룹을 생성하려면 * "+"새 모니터 그룹 생성 * 버튼을 클릭합니다. 그룹 이름을 입력하고 * 그룹 생성 * 을 클릭합니다. 해당 이름으로 빈 그룹이 생성됩니다.
그룹에 모니터를 추가하려면 _All Monitors_group(권장)으로 이동하여 다음 중 하나를 수행합니다.
-
단일 모니터를 추가하려면 모니터 오른쪽에 있는 메뉴를 클릭하고 _Add to Group_을 선택합니다. 모니터를 추가할 그룹을 선택합니다.
-
모니터 이름을 클릭하여 모니터의 편집 보기를 열고 Associate to a monitor group 섹션에서 그룹을 선택합니다.
그룹을 클릭하고 메뉴에서 _Remove from Group_을 선택하여 모니터를 제거합니다. 모든 모니터 또는 _Custom Monitors_그룹에서 모니터를 제거할 수 없습니다. 이러한 그룹에서 모니터를 삭제하려면 모니터 자체를 삭제해야 합니다.
그룹에서 모니터를 제거해도 Data Infrastructure Insights에서 모니터가 삭제되지는 않습니다. 모니터를 완전히 제거하려면 모니터를 선택하고 _Delete_를 클릭합니다. 또한 이 작업은 해당 그룹이 속한 그룹에서 제거되며 더 이상 모든 사용자가 사용할 수 없습니다. |
또한 _ Move to Group _ 을(를) 선택하여 같은 방식으로 모니터를 다른 그룹으로 이동할 수도 있습니다.
그룹의 모든 모니터를 한 번에 일시 중지하거나 다시 시작하려면 해당 그룹의 메뉴를 선택하고 _Pause_or_Resume_을 클릭합니다.
동일한 메뉴를 사용하여 그룹의 이름을 바꾸거나 그룹을 삭제합니다. 그룹을 삭제해도 Data Infrastructure Insights에서 모니터가 삭제되지는 않으며 _모든 모니터_에서 계속 사용할 수 있습니다.
시스템 정의 모니터
Data Infrastructure Insights에는 메트릭 및 로그 모두에 대해 다수의 시스템 정의 모니터가 포함되어 있습니다. 사용 가능한 시스템 모니터는 사용자 환경에 있는 데이터 수집기에 따라 다릅니다. 따라서 데이터 수집기가 추가되거나 구성이 변경되면 Data Infrastructure Insights에서 사용할 수 있는 모니터가 변경될 수 있습니다.
"시스템 정의 모니터"Data Infrastructure Insights에 포함된 모니터에 대한 설명은 페이지를 참조하십시오.