创建自定义警报规则
您可以创建自定义警报规则来定义自己触发警报的条件。
-
您将使用登录到网格管理器 支持的 Web 浏览器
-
您具有 " 管理警报 " 或 " 根访问 " 权限
-
您也可以观看以下视频: "视频:使用指标创建自定义警报"
StorageGRID 不会验证自定义警报。如果您决定创建自定义警报规则,请遵循以下一般准则:
-
查看默认警报规则的条件,并将其用作自定义警报规则的示例。
-
如果为警报规则定义了多个条件,请对所有条件使用相同的表达式。然后,更改每个条件的阈值。
-
仔细检查每个条件是否存在拼写错误和逻辑错误。
-
请仅使用网格管理 API 中列出的指标。
-
在使用网格管理 API 测试表达式时,请注意 "
s成功
" 响应可能只是空响应正文(未触发警报)。要查看警报是否实际触发,您可以临时将阈值设置为您希望当前为 true 的值。例如,要测试表达式
node_memory_MemTotal_bytes < 240000000
,请先执行node_memory_MemTotal_bytes >= 0
并确保获得预期结果(所有节点均返回一个值)。然后,将运算符和阈值改回预期值并重新执行。无结果表明此表达式当前没有警报。 -
除非您验证警报是在预期时间触发的,否则请勿假定自定义警报正在运行。
-
选择 * 警报 * > * 规则 * 。
此时将显示 "Alert Rules" 页面。
-
选择 * 创建自定义规则 * 。
此时将显示创建自定义规则对话框。
-
选中或取消选中 * 已启用 * 复选框以确定当前是否已启用此警报规则。
如果禁用了警报规则,则不会评估其表达式,也不会触发任何警报。
-
输入以下信息:
字段 Description 唯一名称
此规则的唯一名称。警报规则名称显示在警报页面上,也是电子邮件通知的主题。警报规则的名称可以介于 1 到 64 个字符之间。
Description
所发生问题的问题描述 。问题描述 是警报页面和电子邮件通知中显示的警报消息。警报规则的说明可以介于 1 到 128 个字符之间。
建议的操作
也可以选择触发此警报时建议采取的操作。以纯文本格式输入建议的操作(无格式化代码)。警报规则的建议操作可以介于 0 到 1 , 024 个字符之间。
-
在条件部分中,为一个或多个警报严重性级别输入一个 Prometheus 表达式。
基本表达式通常采用以下形式:
` ,指标,运算符,值,`
表达式可以是任意长度,但会显示在用户界面的单行上。至少需要一个表达式。
如果节点的已安装 RAM 量小于 24 , 000 , 000 , 000 字节( 24 GB ),则此表达式会触发警报。
node_memory_MemTotal_bytes < 240000000
要查看可用指标并测试 Prometheus 表达式,请选择帮助图标 并单击网格管理 API 中的指标部分链接。
-
在 * 持续时间 * 字段中,输入在触发警报之前条件必须持续保持有效的时间量,然后选择一个时间单位。
要在条件变为 true 时立即触发警报,请输入 * 。增加此值可防止临时条件触发警报。
默认值为 5 分钟。
-
选择 * 保存 * 。
此时,对话框将关闭,新的自定义警报规则将显示在 "Alert Rules" 表中。