监控警报

StorageGRID 警报可帮助您评估并快速解决正常运行期间有时发生的故障点。如果属性满足特定条件或超过配置的阈值,则可能会触发警报。

警报严重性级别

从正常(无警报或通知)到严重,警报组织成五个严重性级别的层次结构。这两个服务状态通知用于指示节点何时与网格断开连接。

图标 节点状态 警报严重性 含义
绿色复选标记图标 Connected 正常 节点运行正常。它已连接到网格,没有警报。
黄色方形图标 Connected 通知 节点已连接到网格,但存在不影响正常操作的异常情况。
浅橙色钻石图标 Connected 次要 节点已连接到网格,但存在异常情况,可能会影响未来的运行。您应进行调查以防止上报。
深橙色钻石图标 Connected 主要 节点已连接到网格,但存在当前影响操作的异常情况。这需要立即引起注意,以防止升级。
红色 x 图标 Connected 严重 节点已连接到网格,但存在已停止正常操作的异常情况。您应立即解决此问题。
灰色问号图标 Disconnected 已管理员关闭 由于预期原因,节点未连接到网格。例如,节点或节点上的服务已正常关闭,节点正在重新启动或软件正在升级。
蓝色问号图标 Disconnected 未知 节点未连接到网格。这种情况需要立即引起注意,例如,节点之间的网络连接已断开或电源已关闭。这是最严重的情况。
注: 在受管关闭操作期间,您可能会看到瞬时蓝色节点。您可以忽略这些警报。

警报类

警报分为三类:
  • 默认警报是随 StorageGRID 系统提供的警报。每个默认警报都会跟踪特定属性的值。例如, AMQS (已排队的审核消息) Default 警报可跟踪任意给定时间审核消息队列中的消息数。当排队的消息数量达到特定阈值时,此警报将在不同的严重性下触发。


    默认警报

    无法修改默认警报。但是,您可以禁用默认警报或通过定义全局自定义警报或自定义警报来覆盖这些警报。

  • 全局自定义警报可监控 StorageGRID 系统中给定类型的所有服务的状态。您可以创建全局自定义警报以覆盖系统范围内的默认警报。您还可以创建一个新的全局自定义警报,用于监控系统范围的状态。这对于监控 StorageGRID 系统的任何自定义条件非常有用。
  • 自定义警报可监控单个服务或组件的状态。您可以创建自定义警报以在服务或组件级别覆盖默认警报或全局自定义警报。您还可以根据服务的独特要求创建新的自定义警报。

警报通知

当触发警报或服务状态发生变化时,电子邮件通知会让指定人员知道系统需要引起注意。当警报离开警报级别时,也会发送通知—解决或输入其他警报严重性级别。