对于默认警报规则,您可以更改规则的启用 / 禁用状态,次要警报,主要警报和严重警报的条件以及持续时间。对于自定义警报规则,您还可以编辑规则的名称,说明和建议的操作。
开始之前
- 您必须使用支持的浏览器登录到网格管理器。
- 您必须具有 root 访问权限。
过程
-
选择 Alarms。 然后,在菜单的警报(预览)部分中,选择 Rules。
Alert Rules此时将显示页面。
- 选择要编辑的警报规则对应的单选按钮。
- 选择Edit rule。
此时将显示以下对话框。此示例显示了一个默认警报规则—无法编辑名称,说明和建议的操作。

- 选中或取消选中 Enabled 此复选框以确定当前是否已启用此警报规则。
如果禁用了警报规则,则不会评估其表达式,也不会触发任何警报。
注: 如果对活动警报禁用警报规则,则必须等待几分钟,使警报不再显示在警报页面上。
- 对于自定义警报规则,请根据需要更新以下信息。
注: 您不能为默认警报规则编辑此信息。
字段 |
说明 |
唯一名称 |
此规则的唯一名称。 警报规则名称显示在警报页面上,也是电子邮件通知的主题。警报规则的名称可以介于 1 到 64 个字符之间。
|
说明 |
所发生问题的说明。 说明是指警报页面和电子邮件通知中显示的警报消息。警报规则的说明可以介于 1 到 128 个字符之间。
|
建议操作 |
也可以选择触发此警报时建议采取的操作。 以纯文本格式输入建议的操作(无格式化代码)。警报规则的建议操作可以介于 0 到 1 , 024 个字符之间。
|
- 在条件部分中,输入或更新一个或多个警报严重性级别的 Prometheus 表达式。
注: 如果要将已编辑默认警报规则的条件还原为其原始值,请单击已修改条件右侧的三个点。

注: 如果您更新活动警报的条件,则在解决上一条件之前,可能无法实施您的更改。下次满足规则的其中一个条件时,警报将反映更新后的值。
基本表达式通常采用以下形式:
[ 度量单位 ] [ 运算符 ] [ 值 ]
表达式可以是任意长度,但会显示在用户界面的单行上。至少需要一个表达式。
要查看可用指标并测试 Prometheus 表达式,请单击帮助图标
并单击指向 网格管理 API的指标部分的链接。
要了解如何使用 网格管理 API,请参见有关管理 StorageGRID的说明。有关 Prometheus 查询语法的详细信息,请参见 Prometheus 2.3 文档。
如果节点的已安装 RAM 量小于 24 , 000 , 000 , 000 字节( 24 GB ),则此表达式会触发警报。
node_memory_MemTotal < 240000000
- 在 Duration 字段中,输入触发警报之前条件必须持续保持有效的时间量,然后选择时间单位。
要在条件变为 true 时立即触发警报,请输入 0。增加此值可防止临时条件触发警报。
默认值为 5 分钟。
- 单击 Save。