경고를 모니터링하고 관리합니다
이 경고 시스템은 StorageGRID 작동 중에 발생할 수 있는 문제를 감지, 평가 및 해결하기 위한 사용이 간편한 인터페이스를 제공합니다.
경고 시스템은 StorageGRID 시스템에서 발생할 수 있는 문제를 모니터링하는 기본 도구로 설계되었습니다.
-
알림 시스템은 시스템에서 실행 가능한 문제에 초점을 맞춥니다. 경고는 안전하게 무시할 수 있는 이벤트가 아니라 즉각적인 주의가 필요한 이벤트에 대해 트리거됩니다.
-
Current Alerts 및 Resolved Alerts 페이지에서는 현재 및 과거 문제를 볼 수 있는 사용자 친화적인 인터페이스를 제공합니다. 개별 알림 및 알림 그룹을 기준으로 목록을 정렬할 수 있습니다. 예를 들어 모든 알림을 노드/사이트별로 정렬하여 특정 노드에 영향을 미치는 알림을 확인할 수 있습니다. 또는 특정 알림의 가장 최근 인스턴스를 찾기 위해 트리거된 시간을 기준으로 그룹의 알림을 정렬할 수 있습니다.
-
동일한 유형의 여러 알림이 하나의 이메일로 그룹화되어 알림 수가 줄어듭니다. 또한 동일한 유형의 여러 알림이 현재 경고 및 해결된 경고 페이지에 그룹으로 표시됩니다. 알림 그룹을 확장하고 축소하여 개별 알림을 표시하거나 숨길 수 있습니다. 예를 들어, 여러 노드에서 * 노드 * 경고와 통신할 수 없음 알림을 보고하는 경우 하나의 이메일만 전송되고 해당 알림은 현재 알림 페이지에 하나의 그룹으로 표시됩니다.
-
알림은 직관적인 이름과 설명을 사용하여 문제의 원인을 보다 빠르게 파악할 수 있도록 도와줍니다. 알림 알림에는 영향을 받는 노드 및 사이트에 대한 세부 정보, 알림 심각도, 알림 규칙이 트리거된 시간, 경고와 관련된 메트릭의 현재 값이 포함됩니다.
-
경고 이메일 알림 및 현재 경고 및 해결된 경고 페이지의 경고 목록은 경고 해결을 위한 권장 조치를 제공합니다. 이러한 권장 조치에는 보다 자세한 문제 해결 절차를 쉽게 찾아 액세스할 수 있도록 StorageGRID 문서에 대한 직접 링크가 포함되어 있는 경우가 많습니다.
기존 경보 시스템은 더 이상 사용되지 않습니다. 레거시 알람 시스템의 사용자 인터페이스 및 API는 향후 릴리즈에서 제거될 예정입니다. 경고 시스템은 상당한 이점을 제공하며 사용이 간편합니다. |
알림을 관리합니다
모든 StorageGRID 사용자는 경고를 볼 수 있습니다. 루트 액세스 또는 알림 관리 권한이 있는 경우 다음과 같이 알림을 관리할 수도 있습니다.
-
하나 이상의 심각도 수준에서 알림에 대한 알림을 일시적으로 억제해야 하는 경우 지정된 기간 동안 특정 알림 규칙을 쉽게 해제할 수 있습니다. 전체 그리드, 단일 사이트 또는 단일 노드에 대한 경고 규칙을 해제할 수 있습니다.
-
필요에 따라 기본 경고 규칙을 편집할 수 있습니다. 경고 규칙을 완전히 비활성화하거나 트리거 조건 및 기간을 변경할 수 있습니다.
-
사용자 정의 경고 규칙을 생성하여 자신의 상황과 관련된 특정 조건을 타겟팅하고 자신만의 권장 조치를 제공할 수 있습니다. 사용자 지정 알림의 조건을 정의하려면 Grid Management API의 Metrics 섹션에서 사용할 수 있는 Prometheus 메트릭을 사용하여 표현식을 생성합니다.
예를 들어, 이 식을 사용하면 노드에 설치된 RAM의 양이 24,000,000,000,000바이트(24GB) 미만인 경우 경고가 트리거됩니다.
node_memory_MemTotal < 24000000000