Skip to main content
Data Infrastructure Insights
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

查看和管理監視器的警報

貢獻者 netapp-alavoie

Data Infrastructure Insights在以下情況下顯示警報"監控閾值"超出了。

提示 監控和警報功能可在Data Infrastructure Insights標準版及更高版本中使用。

查看和管理警報

若要查看和管理警報,請執行下列操作。

  1. 導覽至*警報 > 所有警報*頁面。

  2. 顯示最多最近 1,000 個警報的清單。您可以透過按一下欄位的列標題來按任何欄位對該清單進行排序。此清單顯示以下資訊。請注意,預設並非所有這些列都會顯示。您可以透過點擊“齒輪”圖示來選擇要顯示的列:

    • 警報 ID:系統產生的唯一警報 ID

    • 觸發時間:相關監視器觸發警報的時間

    • 目前嚴重程度(活動警報標籤):活動警報的當前嚴重程度

    • 最高嚴重程度(已解決警報選項卡);警報在解決之前的最高嚴重程度

    • 監視器:配置為觸發警報的監視器

    • 觸發條件:超出監控閾值的對象

    • 狀態:目前警報狀態,新_或_處理中

    • 活動狀態活動_或_已解決

    • 條件:觸發警報的閾值條件

    • 指標:超出監控閾值的物件指標

    • 監視器狀態:觸發警報的監視器的目前狀態

    • 有糾正措施:警報已建議採取糾正措施。打開警報頁面即可查看這些內容。

您可以透過點擊警報右側的選單並選擇以下選項之一來管理警報:

  • 處理中 表示警報正在調查中或需要保持開啟狀態

  • 關閉 從活動警報清單中刪除警報。

您可以透過選取每個警報左側的核取方塊並按一下「變更選取警報狀態」來管理多個警報。

點擊警報 ID 將開啟警報詳細資訊頁面。

警報詳細資訊面板

選擇任意警報行以開啟警報的詳細資訊面板。警報詳細資訊面板提供有關警報的更多詳細信息,包括_摘要_、顯示與物件資料相關的圖表的_性能_部分、任何_相關資產_以及警報調查員輸入的_評論_。

指標警報詳細資訊面板

資料遺失時發出警報

在諸如Data Infrastructure Insights之類的即時系統中,為了觸發監視器的分析以決定是否應產生警報,我們依賴以下兩件事之一:

  • 下一個到達的數據點

  • 當沒有數據點並且您已經等待了足夠長的時間時觸發的計時器

與資料到達緩慢或無資料到達的情況一樣,計時器機制需要接管,因為資料到達率不足以「即時」觸發警報。因此問題通常變成“我要等多久才能關閉分析視窗並查看我所擁有的內容?”如果等待的時間太長,則產生的警報速度不夠快,無法發揮作用。

如果您有一個 30 分鐘視窗的監視器,它注意到長期資料遺失之前的最後一個資料點違反了某個條件,則會產生警報,因為監視器沒有收到其他資訊來確認指標的恢復或註意到該條件持續存在。

「永久活動」警報

可以以這樣的方式配置監視器,使條件*始終*存在於監視物件上 - 例如,IOPS > 1 或延遲 > 0。這些通常被創建為“測試”監視器,然後就被遺忘了。此類監視器會在組成物件上建立永久開啟的警報,隨著時間的推移,這可能會導致系統壓力和穩定性問題。

為防止這種情況,Data Infrastructure Insights將在 7 天後自動關閉任何「永久活動」警報。請注意,底層監控條件可能(很可能會)繼續存在,導致幾乎立即發出新的警報,但關閉「始終活動」警報可以減輕可能發生的一些系統壓力。