Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

建立自訂警報規則

您可以建立自訂警報規則來定義觸發警報的條件。

開始之前
關於此任務

StorageGRID不驗證自訂警報。如果您決定建立自訂警報規則,請遵循以下一般準則:

  • 查看預設警報規則的條件,並將其用作自訂警報規則的範例。

  • 如果為警報規則定義多個條件,請對所有條件使用相同的表達式。然後,改變每個條件的閾值。

  • 仔細檢查每個條件是否有拼字錯誤和邏輯錯誤。

  • 僅使用網格管理 API 中列出的指標。

  • 當使用網格管理 API 測試表達式時,請注意「成功」回應可能是空的回應主體(未觸發警報)。若要查看警報是否已真正觸發,您可以暫時將閾值設為您預計目前為真的值。

    例如,測試表達式 node_memory_MemTotal_bytes < 24000000000,先執行 `node_memory_MemTotal_bytes >= 0`並確保獲得預期的結果(所有節點都傳回一個值)。然後,將運算符和閾值改回預期值並再次執行。沒有結果表示此表達式目前沒有警報。

  • 除非您已驗證警報是否在預期時觸發,否則不要假設自訂警報正在起作用。

步驟
  1. 選擇*警報* > 規則

    出現「警報規則」頁面。

  2. 選擇*建立自訂規則*。

    出現「建立自訂規則」對話方塊。

    警報 > 建立自訂規則
  3. 選取或清除「已啟用」核取方塊以確定此警報規則目前是否已啟用。

    如果停用警報規則,則不會評估其表達式,也不會觸發任何警報。

  4. 輸入以下資訊:

    場地 描述

    唯一名稱

    此規則的唯一名稱。警報規則名稱顯示在警報頁面上,也是電子郵件通知的主題。警報規則的名稱長度可以為 1 到 64 個字元。

    描述

    正在發生的問題的描述。該描述是警報頁面和電子郵件通知中顯示的警報訊息。警報規則的描述長度可以為 1 到 128 個字元。

    建議措施

    可選地,當觸發此警報時建議採取的操作。以純文字輸入建議的操作(無格式代碼)。警報規則的建議操作可以介於 0 到 1,024 個字元之間。

  5. 在條件部分中,輸入一個或多個警報嚴重性等級的 Prometheus 表達式。

    基本表達式通常具有以下形式:

    [metric] [operator] [value]

    表達式可以是任意長度,但在使用者介面中只出現在一行上。至少需要一個表達式。

    如果節點安裝的 RAM 數量少於 24,000,000,000 位元組(24 GB),則此表達式會觸發警報。

    node_memory_MemTotal_bytes < 24000000000

    若要查看可用指標並測試 Prometheus 表達式,請選擇幫助圖示問號圖示並按照連結進入網格管理 API 的指標部分。

  6. 在「持續時間」欄位中,輸入觸發警報之前條件必須持續有效的時間量,然後選擇一個時間單位。

    若要在條件成立時立即觸發警報,請輸入 0。增加此值以防止臨時情況觸發警報。

    預設值為 5 分鐘。

  7. 選擇*儲存*。

    對話方塊關閉,新的自訂警報規則出現在警報規則表中。