查看特定警报
您可以查看有关当前正在影响 StorageGRID 系统的警报或已解决的警报的详细信息。详细信息包括建议的更正操作,触发警报的时间以及与此警报相关的指标的当前值。
-
您将使用登录到网格管理器 支持的 Web 浏览器。
-
根据您要查看当前警报还是已解决警报,执行以下操作之一:
列标题 Description 当前警报
-
从信息板上的 " 运行状况 " 面板中,单击 * 当前警报 * 链接。只有当前至少有一个警报处于活动状态时,才会显示此链接。如果当前没有警报或当前所有警报均已静音,则此链接将隐藏。
-
选择 * 警报 * > * 当前 * 。
-
从 * 节点 * 页面中,为具有警报图标的节点选择 * 概述 * 选项卡。然后,在警报部分中,单击警报名称。
已解决警报
-
从信息板上的 " 运行状况 " 面板中,单击 * 最近解决的警报 * 链接。(只有在过去一周触发了一个或多个警报且现已解决时,才会显示此链接。如果上周未触发和解决任何警报,则此链接将隐藏。)
-
选择 * 警报 * > * 已解决 * 。
-
-
根据需要展开一组警报,然后选择要查看的警报。
选择警报,而不是一组警报的标题。 此时将显示一个对话框,其中提供了选定警报的详细信息。
-
查看警报详细信息。
信息 Description title
警报的名称。
第一段 _
警报的问题描述 。
建议的操作
此警报的建议操作。
时间已触发
在您当地时间和 UTC 时间触发警报的日期和时间。
已解决时间
仅对于已解决的警报,是指在您当地时间和 UTC 解决警报的日期和时间。
Status
警报的状态:活动,静音或已解决。
站点 / 节点
受警报影响的站点和节点的名称。
severity
警报的严重性。
-
* 严重 * :存在已停止 StorageGRID 节点或服务正常运行的异常情况。您必须立即解决底层问题描述 。如果未解决问题描述 ,可能会导致服务中断和数据丢失。
-
* 主要 * :存在影响当前操作或接近严重警报阈值的异常情况。您应调查主要警报并解决任何根本问题,以确保异常情况不会停止 StorageGRID 节点或服务的正常运行。
-
* 次要 * :系统运行正常,但存在异常情况,如果系统继续运行,可能会影响系统的运行能力。您应监控和解决自身未清除的小警报,以确保它们不会导致更严重的问题。
数据值 _
此警报的指标的当前值。对于某些警报,还会显示其他值,以帮助您了解和调查此警报。例如,为 "* 低元数据存储 * " 警报显示的值包括已用磁盘空间百分比,磁盘空间总量和已用磁盘空间量。
-
-
或者,也可以单击 * 静默此警报 * 以静默导致触发此警报的警报规则。
要使警报规则静默,您必须具有管理警报或 root 访问权限。
在决定静默警报规则时,请务必小心。如果某个警报规则已静音,则在阻止完成关键操作之前,您可能无法检测到潜在问题。 -
要查看警报规则的当前条件,请执行以下操作:
-
在警报详细信息中,单击 * 查看条件 * 。
此时将显示一个弹出窗口,其中列出了每个已定义严重性的 Prometheus 表达式。
-
要关闭此弹出窗口,请单击此弹出窗口以外的任意位置。
-
-
或者,也可以单击 * 编辑规则 * 来编辑导致触发此警报的警报规则:
要编辑警报规则,您必须具有管理警报或 root 访问权限。
决定编辑警报规则时请务必小心。如果更改了触发值,则可能无法检测到潜在问题,直到它阻止完成关键操作为止。 -
要关闭警报详细信息,请单击 * 关闭 * 。