Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

경고 모니터링 및 관리

기여자

이 경고 시스템은 StorageGRID 작동 중에 발생할 수 있는 문제를 감지, 평가 및 해결하기 위한 사용이 간편한 인터페이스를 제공합니다.

경고 시스템은 StorageGRID 시스템에서 발생할 수 있는 문제를 모니터링하는 기본 도구로 설계되었습니다.

  • 알림 시스템은 시스템에서 실행 가능한 문제에 초점을 맞춥니다. 경고는 안전하게 무시할 수 있는 이벤트가 아니라 즉각적인 주의가 필요한 이벤트에 대해 트리거됩니다.

  • Current Alerts 및 Resolved Alerts 페이지에서는 현재 및 과거 문제를 볼 수 있는 사용자 친화적인 인터페이스를 제공합니다. 개별 알림 및 알림 그룹을 기준으로 목록을 정렬할 수 있습니다. 예를 들어 모든 알림을 노드/사이트별로 정렬하여 특정 노드에 영향을 미치는 알림을 확인할 수 있습니다. 또는 특정 알림의 가장 최근 인스턴스를 찾기 위해 트리거된 시간을 기준으로 그룹의 알림을 정렬할 수 있습니다.

  • 동일한 유형의 여러 알림이 하나의 이메일로 그룹화되어 알림 수가 줄어듭니다. 또한 동일한 유형의 여러 알림이 현재 경고 및 해결된 경고 페이지에 그룹으로 표시됩니다. 알림 그룹을 확장하고 축소하여 개별 알림을 표시하거나 숨길 수 있습니다. 예를 들어, 여러 노드에서 * 노드 * 경고와 통신할 수 없음 알림을 보고하는 경우 하나의 이메일만 전송되고 해당 알림은 현재 알림 페이지에 하나의 그룹으로 표시됩니다.

    경고 페이지
  • 알림은 직관적인 이름과 설명을 사용하여 문제의 원인을 보다 빠르게 파악할 수 있도록 도와줍니다. 알림 알림에는 영향을 받는 노드 및 사이트에 대한 세부 정보, 알림 심각도, 알림 규칙이 트리거된 시간, 경고와 관련된 메트릭의 현재 값이 포함됩니다.

  • 경고 이메일 알림 및 현재 경고 및 해결된 경고 페이지의 경고 목록은 경고 해결을 위한 권장 조치를 제공합니다. 이러한 권장 조치에는 보다 자세한 문제 해결 절차를 쉽게 찾아 액세스할 수 있도록 StorageGRID 문서에 대한 직접 링크가 포함되어 있는 경우가 많습니다.

    경고 페이지 세부 정보 모달
참고 기존 알람 시스템은 계속 지원되지만, 알림 시스템은 상당한 이점을 제공하며 사용이 간편합니다.

알림 관리

모든 StorageGRID 사용자는 경고를 볼 수 있습니다. 루트 액세스 또는 알림 관리 권한이 있는 경우 다음과 같이 알림을 관리할 수도 있습니다.

  • 하나 이상의 심각도 수준에서 알림에 대한 알림을 일시적으로 억제해야 하는 경우 지정된 기간 동안 특정 알림 규칙을 쉽게 해제할 수 있습니다. 전체 그리드, 단일 사이트 또는 단일 노드에 대한 경고 규칙을 해제할 수 있습니다.

  • 필요에 따라 기본 경고 규칙을 편집할 수 있습니다. 경고 규칙을 완전히 비활성화하거나 트리거 조건 및 기간을 변경할 수 있습니다.

  • 사용자 정의 경고 규칙을 생성하여 자신의 상황과 관련된 특정 조건을 타겟팅하고 자신만의 권장 조치를 제공할 수 있습니다. 사용자 지정 알림의 조건을 정의하려면 Grid Management API의 Metrics 섹션에서 사용할 수 있는 Prometheus 메트릭을 사용하여 표현식을 생성합니다.

    예를 들어, 이 식을 사용하면 노드에 설치된 RAM의 양이 24,000,000,000,000바이트(24GB) 미만인 경우 경고가 트리거됩니다.

    node_memory_MemTotal < 24000000000
  • 관련 정보 *