Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

为警报设置电子邮件通知

贡献者

如果您希望在出现警报时发送电子邮件通知,则必须提供有关 SMTP 服务器的信息。您还必须输入警报通知收件人的电子邮件地址。

您需要的内容
  • 您将使用登录到网格管理器 支持的 Web 浏览器

  • 您具有 " 管理警报 " 或 " 根访问 " 权限。

关于此任务

由于警报和警报是独立的系统,因此用于警报通知的电子邮件设置不会用于警报通知和 AutoSupport 消息。但是,您可以对所有通知使用同一个电子邮件服务器。

如果您的 StorageGRID 部署包含多个管理节点,则可以选择哪个管理节点应是警报通知的首选发送方。警报通知和 AutoSupport 消息也会使用相同的 "`首选发件人` " 。默认情况下,会选择主管理节点。有关详细信息,请参见 有关管理 StorageGRID 的说明

步骤
  1. 选择 * 警报 * > * 电子邮件设置 * 。

    此时将显示电子邮件设置页面。

    已禁用警报电子邮件设置
  2. 选中 * 启用电子邮件通知 * 复选框,以指示您希望在警报达到配置的阈值时发送通知电子邮件。

    此时将显示电子邮件( SMTP )服务器,传输层安全( TLS ),电子邮件地址和筛选器部分。

  3. 在电子邮件( SMTP )服务器部分中,输入 StorageGRID 访问 SMTP 服务器所需的信息。

    如果 SMTP 服务器需要身份验证,则必须同时提供用户名和密码。

    字段 输入 …​

    邮件服务器

    SMTP 服务器的完全限定域名( FQDN )或 IP 地址。

    Port

    用于访问 SMTP 服务器的端口。必须介于 1 到 65535 之间。

    用户名(可选)

    如果 SMTP 服务器需要身份验证,请输入要进行身份验证的用户名。

    密码(可选)

    如果 SMTP 服务器需要身份验证,请输入用于进行身份验证的密码。

    警报电子邮件 SMTP 服务器
  4. 在电子邮件地址部分中,输入发件人和每个收件人的电子邮件地址。

    1. 对于 * 发件人电子邮件地址 * ,请指定一个有效的电子邮件地址,用作警报通知的发件人地址。

      例如: storagegrid-alerts@example.com

    2. 在收件人部分中,为每个电子邮件列表或发生警报时应接收电子邮件的人员输入电子邮件地址。

      选择加号图标 加号图标 以添加收件人。

    警报电子邮件收件人
  5. 如果要与 SMTP 服务器进行通信,需要使用传输层安全( TLS ),请在传输层安全( TLS )部分中选择 * 需要 TLS* 。

    1. 在 * CA 证书 * 字段中,提供用于验证 SMTP 服务器标识的 CA 证书。

      您可以将内容复制并粘贴到此字段中,或者选择 * 浏览 * 并选择文件。

      您必须提供一个文件,其中包含来自每个中间颁发证书颁发机构( CA )的证书。此文件应包含 PEM 编码的每个 CA 证书文件,并按证书链顺序串联。

    2. 如果 SMTP 电子邮件服务器要求电子邮件发件人提供用于身份验证的客户端证书,请选中 * 发送客户端证书 * 复选框。

    3. 在 * 客户端证书 * 字段中,提供 PEM 编码的客户端证书以发送到 SMTP 服务器。

      您可以将内容复制并粘贴到此字段中,或者选择 * 浏览 * 并选择文件。

    4. 在 * 专用密钥 * 字段中,输入未加密 PEM 编码的客户端证书的专用密钥。

      您可以将内容复制并粘贴到此字段中,或者选择 * 浏览 * 并选择文件。

      备注 如果需要编辑电子邮件设置,请选择铅笔图标以更新此字段。
    警报电子邮件 TLS
  6. 在筛选器部分中,选择应导致电子邮件通知的警报严重性级别,除非特定警报的规则已被静音。

    severity Description

    次要,重大,严重

    满足警报规则的次要,主要或严重条件时,系统会发送电子邮件通知。

    主要,关键

    当满足警报规则的主要或关键条件时,系统会发送电子邮件通知。不会针对次要警报发送通知。

    仅严重

    只有在满足警报规则的严重条件时,才会发送电子邮件通知。对于次要或主要警报,不会发送通知。

    警报电子邮件筛选器
  7. 准备好测试电子邮件设置后,请执行以下步骤:

    1. 选择 * 发送测试电子邮件 * 。

      此时将显示一条确认消息,指示已发送测试电子邮件。

    2. 检查所有电子邮件收件人的收件箱,确认已收到测试电子邮件。

      备注 如果在几分钟内未收到电子邮件,或者触发了 * 电子邮件通知失败 * 警报,请检查您的设置并重试。
    3. 登录到任何其他管理节点并发送测试电子邮件以验证所有站点的连接。

      备注 在测试警报通知时,您必须登录到每个管理节点以验证连接。这与测试警报通知和 AutoSupport 消息不同,所有管理节点都会发送测试电子邮件。
  8. 选择 * 保存 * 。

    发送测试电子邮件不会保存您的设置。您必须选择 * 保存 * 。

    此时将保存电子邮件设置。

警报电子邮件通知中包含的信息

配置 SMTP 电子邮件服务器后,在触发警报时,系统会向指定的收件人发送电子邮件通知,除非警报规则被静默禁止。请参见 静默警报通知

电子邮件通知包括以下信息:

警报电子邮件通知
Callout Description

1.

警报名称,后跟此警报的活动实例数。

2.

警报的问题描述 。

3.

为警报建议的任何操作。

4.

有关警报的每个活动实例的详细信息,包括受影响的节点和站点,警报严重性,触发警报规则的 UTC 时间以及受影响作业和服务的名称。

5.

发送通知的管理节点的主机名。

如何对警报进行分组

为了防止在触发警报时发送过多的电子邮件通知, StorageGRID 会尝试在同一通知中对多个警报进行分组。

有关 StorageGRID 如何在电子邮件通知中对多个警报进行分组的示例,请参见下表。

行为 示例

每个警报通知仅适用于同名警报。如果同时触发两个名称不同的警报,则会发送两封电子邮件通知。

  • 警报 A 会同时在两个节点上触发。仅发送一个通知。

  • 节点 1 上触发警报 A ,节点 2 上同时触发警报 B 。系统会发送两个通知—每个警报一个。

对于特定节点上的特定警报,如果达到阈值的严重性超过一个,则仅针对最严重警报发送通知。

  • 此时将触发警报 A ,并达到次要,主要和严重警报阈值。系统会为严重警报发送一条通知。

首次触发警报时, StorageGRID 会等待 2 分钟,然后再发送通知。如果在此期间触发了其他同名警报,则 StorageGRID 会在初始通知中对所有警报进行分组。​

  1. 节点 1 上的警报 A 在 08 : 00 触发。不会发送任何通知。

  2. 节点 2 上的警报 A 在 08 : 01 触发。不会发送任何通知。

  3. 8 : 02 发送通知以报告两个警报实例。

如果触发另一个同名警报, StorageGRID 将等待 10 分钟,然后再发送新通知。新通知会报告所有活动警报(当前未静音的警报),即使先前已报告这些警报也是如此。

  1. 节点 1 上的警报 A 在 08 : 00 触发。通知在 08 : 02 发送。

  2. 节点 2 上的警报 A 在 08 : 05 触发。第二个通知将在 8 : 15 ( 10 分钟后)发送。此时将报告这两个节点。

如果当前存在多个同名警报且其中一个警报已解决,则在已解决警报的节点上重新出现此警报时,不会发送新通知。

  1. 已针对节点 1 触发警报 A 。此时将发送通知。

  2. 已针对节点 2 触发警报 A 。此时将发送第二个通知。

  3. 已解决节点 2 的警报 A ,但此警报对于节点 1 仍处于活动状态。

  4. 此时将再次触发节点 2 的警报 A 。不会发送任何新通知,因为此警报对于节点 1 仍处于活动状态。

StorageGRID 会继续每 7 天发送一次电子邮件通知,直到所有警报实例均已解决或警报规则已静音为止。

  1. 3 月 8 日为节点 1 触发警报 A 。此时将发送通知。

  2. 警报 A 未解决或静音。其他通知将于 3 月 15 日, 3 月 22 日, 3 月 29 日等时间发送。

对警报电子邮件通知进行故障排除

如果触发了 * 电子邮件通知失败 * 警报,或者您无法收到测试警报电子邮件通知,请按照以下步骤解决问题描述 。

您需要的内容
  • 您将使用登录到网格管理器 支持的 Web 浏览器

  • 您具有 " 管理警报 " 或 " 根访问 " 权限。

步骤
  1. 验证设置。

    1. 选择 * 警报 * > * 电子邮件设置 * 。

    2. 验证电子邮件( SMTP )服务器设置是否正确。

    3. 验证您是否为收件人指定了有效的电子邮件地址。

  2. 检查垃圾邮件筛选器,确保电子邮件未发送到垃圾文件夹。

  3. 请您的电子邮件管理员确认不会阻止来自发件人地址的电子邮件。

  4. 收集管理节点的日志文件,然后联系技术支持。

    技术支持可以使用日志中的信息帮助确定出现问题的原因。例如, prometheus.log 文件在连接到您指定的服务器时可能会显示错误。