编辑警报规则

对于默认警报规则,您可以更改规则的启用 / 禁用状态,次要警报,主要警报和严重警报的条件以及持续时间。对于自定义警报规则,您还可以编辑规则的名称,说明和建议的操作。

开始之前

过程

  1. 选择 Alarms。 然后,在菜单的警报(预览)部分中,选择 Rules
    Alert Rules此时将显示页面。
  2. 选择要编辑的警报规则对应的单选按钮。
  3. 选择Edit rule
    此时将显示以下对话框。此示例显示了一个默认警报规则—无法编辑名称,说明和建议的操作。
    警报 > 编辑规则
  4. 选中或取消选中 Enabled 此复选框以确定当前是否已启用此警报规则。

    如果禁用了警报规则,则不会评估其表达式,也不会触发任何警报。

    注: 如果对活动警报禁用警报规则,则必须等待几分钟,使警报不再显示在警报页面上。
  5. 对于自定义警报规则,请根据需要更新以下信息。
    注: 您不能为默认警报规则编辑此信息。
    字段 说明
    唯一名称 此规则的唯一名称。

    警报规则名称显示在警报页面上,也是电子邮件通知的主题。警报规则的名称可以介于 1 到 64 个字符之间。

    说明 所发生问题的说明。

    说明是指警报页面和电子邮件通知中显示的警报消息。警报规则的说明可以介于 1 到 128 个字符之间。

    建议操作 也可以选择触发此警报时建议采取的操作。

    以纯文本格式输入建议的操作(无格式化代码)。警报规则的建议操作可以介于 0 到 1 , 024 个字符之间。

  6. 在条件部分中,输入或更新一个或多个警报严重性级别的 Prometheus 表达式。
    注: 如果要将已编辑默认警报规则的条件还原为其原始值,请单击已修改条件右侧的三个点。
    警报规则:将已编辑的条件还原为默认值
    注: 如果您更新活动警报的条件,则在解决上一条件之前,可能无法实施您的更改。下次满足规则的其中一个条件时,警报将反映更新后的值。
    基本表达式通常采用以下形式:
    [ 度量单位 ] [ 运算符 ] [ 值 ]

    表达式可以是任意长度,但会显示在用户界面的单行上。至少需要一个表达式。

    要查看可用指标并测试 Prometheus 表达式,请单击帮助图标 问号图标 并单击指向 网格管理 API的指标部分的链接。

    要了解如何使用 网格管理 API,请参见有关管理 StorageGRID的说明。有关 Prometheus 查询语法的详细信息,请参见 Prometheus 2.3 文档。

    如果节点的已安装 RAM 量小于 24 , 000 , 000 , 000 字节( 24 GB ),则此表达式会触发警报。
    node_memory_MemTotal < 240000000
  7. Duration 字段中,输入触发警报之前条件必须持续保持有效的时间量,然后选择时间单位。
    要在条件变为 true 时立即触发警报,请输入 0。增加此值可防止临时条件触发警报。
    默认值为 5 分钟。
  8. 单击 Save