시스템 상태를 모니터링합니다
매일 StorageGRID 시스템의 전반적인 상태를 모니터링합니다.
그리드의 일부를 사용할 수 없는 경우에도 StorageGRID 시스템은 계속 작동할 수 있습니다. 경고로 표시되는 잠재적인 문제가 반드시 시스템 작동에 문제가 되는 것은 아닙니다. Grid Manager 대시보드의 상태 카드에 요약된 문제를 조사합니다.
알림이 트리거되는 즉시 알림을 받으려면 또는 을"SNMP 트랩을 구성합니다"(를) 수행할 수 있습니다 "알림에 대한 이메일 알림을 설정합니다".
문제가 발생하면 추가 세부 정보를 볼 수 있는 링크가 나타납니다.
링크 | 다음과 같은 경우에 나타납니다. |
---|---|
그리드 세부 정보 |
모든 노드의 연결이 끊어졌습니다(접속 상태를 알 수 없음 또는 관리상 중단). |
현재 경고(위험, 주, 보조) |
경고는 입니다현재 활성 상태입니다. |
최근에 해결된 경고 |
지난 주에 트리거된 알림입니다.이제 해결됩니다 |
라이센스 |
이 StorageGRID 시스템의 소프트웨어 라이센스에 문제가 있습니다. 할 수 "필요에 따라 라이센스 정보를 업데이트합니다"있습니다. |
노드 연결 상태를 모니터링합니다
하나 이상의 노드가 그리드에서 분리되면 중요한 StorageGRID 작업이 영향을 받을 수 있습니다. 노드 연결 상태를 모니터링하고 문제를 즉시 해결합니다.
아이콘을 클릭합니다 | 설명 | 작업이 필요합니다 |
---|---|---|
|
알 수 없는 이유로 노드의 연결이 끊기거나 노드의 서비스가 예기치 않게 다운되었습니다. 예를 들어, 노드의 서비스가 중지되거나 전원 장애 또는 예기치 않은 정전으로 인해 노드의 네트워크 연결이 끊겼을 수 있습니다. 노드 * 와 통신할 수 없음 알림도 트리거될 수 있습니다. 다른 알림도 활성화될 수 있습니다. |
즉각적인 주의가 필요합니다. 각 경고를 선택합니다 를 클릭하고 권장 조치를 따릅니다. 예를 들어, 노드의 호스트를 중지하거나 다시 시작한 서비스를 다시 시작해야 할 수 있습니다.
|
|
예상된 이유로 노드가 그리드에 연결되어 있지 않습니다. 예를 들어, 노드의 노드 또는 서비스가 정상적으로 종료되었거나 노드가 재부팅 중이거나 소프트웨어가 업그레이드 중입니다. 하나 이상의 경고가 활성 상태일 수도 있습니다. 이러한 노드는 기본적인 문제를 기반으로 하여 별도의 개입 없이 온라인 상태로 되곤 합니다. |
이 노드에 영향을 주는 알림이 있는지 확인합니다. 하나 이상의 알림이 활성화된 경우 각 경고를 선택합니다권장 조치를 따릅니다. |
|
노드가 그리드에 연결되어 있습니다. |
별도의 조치가 필요 없습니다. |
현재 및 해결된 경고를 봅니다
-
현재 경고 *: 경고가 트리거되면 경고 아이콘이 대시보드에 표시됩니다. 노드 페이지의 노드에 대한 알림 아이콘도 표시됩니다. 이 경우 "경고 e-메일 알림이 구성되었습니다"알림을 해제하지 않는 한 이메일 알림도 전송됩니다.
-
해결된 경고 *: 해결된 경고 기록을 검색하고 볼 수 있습니다.
비디오를 시청한 경우(선택 사항): "비디오: 경고 개요"
다음 표에서는 현재 및 해결된 경고에 대해 Grid Manager에 표시되는 정보를 설명합니다.
열 머리글 | 설명 |
---|---|
이름 또는 제목 |
알림의 이름과 설명입니다. |
심각도입니다 |
알림의 심각도입니다. 현재 알림의 경우 여러 알림이 그룹화되면 제목 행에 각 심각도에 대해 발생한 알림의 인스턴스 수가 표시됩니다. * Critical *: StorageGRID 노드 또는 서비스의 정상 작동을 중지한 비정상 상태가 존재함. 기본 문제를 즉시 해결해야 합니다. 문제가 해결되지 않으면 서비스가 중단되거나 데이터가 손실될 수 있습니다. Major: 현재 작업에 영향을 미치거나 중요 경고에 대한 임계값에 접근하는 비정상적인 상태가 존재합니다. StorageGRID 노드나 서비스의 정상 작동을 비정상적인 상태로 중지하지 않도록 주요 경고를 조사하고 모든 기본 문제를 해결해야 합니다. Minor: 시스템이 정상적으로 작동하고 있지만, 시스템이 계속 작동할 경우 시스템 작동 능력에 영향을 줄 수 있는 비정상적인 상태가 있습니다. 보다 심각한 문제를 초래하지 않도록 자체적으로 명확하지 않은 사소한 경고를 모니터링하고 해결해야 합니다. |
시간 트리거됨 |
|
사이트/노드 |
알림이 발생했거나 발생한 사이트 및 노드의 이름입니다. |
상태 |
경고가 활성, 해제 또는 해결되었는지 여부 여러 개의 경고가 그룹화되고 드롭다운에서 * All alerts * 를 선택하면 제목 행에 해당 경고의 활성 인스턴스 수와 해제된 인스턴스 수가 표시됩니다. |
해결된 시간(해결된 알림만 해당) |
알림이 해결된 지 얼마 전입니다. |
현재 값 또는 _ 데이터 값 _ |
알림이 트리거된 메트릭 값입니다. 일부 경고의 경우 경고를 이해하고 조사하는 데 도움이 되는 추가 값이 표시됩니다. 예를 들어 * Low object data storage * 알림에 표시되는 값에는 사용된 디스크 공간의 비율, 총 디스크 공간 및 사용된 디스크 공간의 양이 포함됩니다.
|
트리거된 값(해결된 알림만 해당) |
알림이 트리거된 메트릭 값입니다. 일부 경고의 경우 경고를 이해하고 조사하는 데 도움이 되는 추가 값이 표시됩니다. 예를 들어 * Low object data storage * 알림에 표시되는 값에는 사용된 디스크 공간의 비율, 총 디스크 공간 및 사용된 디스크 공간의 양이 포함됩니다. |
-
해당 범주의 경고 목록을 보려면 * Current alerts * 또는 * Resolved alerts * 링크를 선택하십시오. 또한 * Nodes * > *NODE * > * Overview * 를 선택한 다음 Alerts 테이블에서 알림을 선택하여 알림에 대한 세부 정보를 볼 수도 있습니다.
기본적으로 현재 경고는 다음과 같이 표시됩니다.
-
가장 최근에 트리거된 경고가 먼저 표시됩니다.
-
동일한 유형의 여러 알림이 그룹으로 표시됩니다.
-
해제된 알림은 표시되지 않습니다.
-
특정 노드의 특정 경고에 대해 둘 이상의 심각도에 대한 임계값에 도달하면 가장 심각한 알림만 표시됩니다. 즉, Minor, Major 및 Critical 심각도에 대한 경고 임계값에 도달하면 Critical 경고만 표시됩니다.
현재 알림 페이지는 2분마다 새로 고쳐집니다.
-
-
알림 그룹을 확장하려면 아래쪽 캐럿을 선택합니다. 그룹에서 개별 알림을 축소하려면 위로 캐럿을 선택하거나 그룹 이름을 선택합니다.
-
알림 그룹 대신 개별 경고를 표시하려면 * Group alerts * 확인란의 선택을 취소합니다.
-
현재 알림 또는 알림 그룹을 정렬하려면 각 열 머리글에서 위쪽/아래쪽 화살표를 선택합니다.
-
Group alerts * 를 선택하면 각 그룹 내의 알림 그룹과 개별 경고가 모두 정렬됩니다. 예를 들어 특정 경고의 가장 최근 인스턴스를 찾기 위해 * 시간 트리거 * 를 기준으로 그룹의 경고를 정렬할 수 있습니다.
-
Group alerts * 가 지워지면 전체 경고 목록이 정렬됩니다. 예를 들어, 특정 노드에 영향을 주는 모든 경고를 보기 위해 * 노드/사이트 * 별로 모든 경고를 정렬할 수 있습니다.
-
-
현재 경고를 상태(* All alerts *, * Active * 또는 * Silenced * 로 필터링하려면 테이블 상단의 드롭다운 메뉴를 사용합니다.
을 "알림 메시지를 해제합니다"참조하십시오.
-
해결된 경고를 정렬하려면
-
트리거 시 * 드롭다운 메뉴에서 기간을 선택합니다.
-
심각도 * 드롭다운 메뉴에서 하나 이상의 심각도를 선택합니다.
-
경고 규칙 * 드롭다운 메뉴에서 하나 이상의 기본 또는 사용자 지정 경고 규칙을 선택하여 특정 경고 규칙과 관련된 해결된 경고를 필터링합니다.
-
노드 * 드롭다운 메뉴에서 하나 이상의 노드를 선택하여 특정 노드와 관련된 해결된 경고를 필터링합니다.
-
-
특정 경고에 대한 세부 정보를 보려면 경고를 선택합니다. 대화 상자는 선택한 경고에 대한 세부 정보 및 권장 조치를 제공합니다.
-
(선택 사항) 특정 경고의 경우 이 알림을 트리거한 알림 규칙을 해제하려면 이 알림 해제 를 선택합니다.
알림 규칙을 해제하려면 가 있어야 "알림 또는 루트 액세스 권한을 관리합니다"합니다.
경고 규칙을 해제할 때는 주의하십시오. 경고 규칙이 해제된 경우 중요한 작업이 완료되지 못하도록 하기 전까지는 기본 문제를 감지하지 못할 수 있습니다. -
알림 규칙의 현재 조건을 보려면:
-
경고 세부 정보에서 * 조건 보기 * 를 선택합니다.
정의된 각 심각도에 대한 Prometheus 표현식이 나열된 팝업이 나타납니다.
-
팝업을 닫으려면 팝업 외부의 아무 곳이나 클릭합니다.
-
-
선택적으로 * 규칙 편집 * 을 선택하여 이 경고가 트리거되도록 한 경고 규칙을 편집합니다.
알림 규칙을 편집하려면 이 있어야 "알림 또는 루트 액세스 권한을 관리합니다"합니다.
알림 규칙을 편집하기로 결정할 때는 주의해야 합니다. 트리거 값을 변경하는 경우 중요한 작업이 완료되지 못할 때까지 기본 문제를 감지하지 못할 수 있습니다. -
경고 세부 정보를 닫으려면 * 닫기 * 를 선택합니다.