異常狀況偵測監視器
異常狀況偵測可深入瞭解租戶資料模式的非預期變更。當物件的行為模式發生變化時,就會發生異常,例如,如果物件在每週三的某個時間發生某種延遲層級,但在接下來的星期三,延遲會在該層級以上時尖峰,這種尖峰會被視為異常。Data Infrastructure Insights 可讓您建立監控器、以便在發生這類異常時發出警示。
異常狀況偵測適用於呈現週期性、可預測模式的物件指標。當這些物件指標高出或低於預期層級時、 Data Infrastructure Insights 會產生警示、以提示調查。
什麼是異常偵測?
當計量的平均值與前幾週的加權平均值有許多標準偏差、而最近幾週的加權平均值比前幾週的加權值更高時、就會發生異常。Data Infrastructure Insights 可在偵測到異常時監控資料和警示。您可以選擇設定偵測的「敏感度」等級。例如、當平均值與平均值的標準差較少時、敏感度會較高、因此會產生更多警示。相反地、較低的靈敏度 = 較低的平均偏差 = 較少的警示。
異常偵測監控與臨界值監控不同。
-
* 臨界值型監控 * 可在您有特定度量的預先定義臨界值時運作。換句話說、當您清楚瞭解預期的內容時(即在正常範圍內)。
-
* 異常偵測監控 * 使用機器學習演算法來識別偏離規範的異常值、因為「正常」的定義不清楚。
我何時需要 Anomaly 偵測?
異常狀況偵測監控可針對許多情況提供實用的警示、包括:
-
當 normal 的定義不明確時。例如、 SAN 錯誤率可能會因連接埠而有所不同。警示某個錯誤是很吵且不必要的、但突然或大幅增加可能表示問題很普遍。
-
隨著時間的變化。工作負載呈現季節性(亦即在特定時間、工作負載忙碌或安靜)。這可能包括非預期的靜止期間、可能表示批次檔位。
-
在手動定義和調整臨界值不切實際的情況下、處理大量資料。例如,擁有大量主機和(或)磁碟區且工作負載各異的租戶。每個 SLA 都可能有不同的 SLA 、因此瞭解超出規範的 SLA 非常重要。
建立異常偵測監視器
若要警示異常狀況、請瀏覽 * 可服務性 > 警示 > +Monitor* 來建立監視器。選取 _ Anomaly Detection Monitor_ 作為監視器類型。
選擇您要監控的物件和度量。您可以像設定其他類型的監視器一樣、設定篩選器和群組。
接著、設定監視器的條件。
-
當所選的度量超過預測範圍 _ 時觸發警示、 _ 低於 _ 這些範圍、或同時低於兩者。
-
將敏感度設為 Medium 、 _Low (偵測到的異常狀況較少)或 High (偵測到的異常狀況較多)。
-
判斷警示層級是 _ 重大 _ 還是 _ 警告 _ 。
-
您也可以選擇將異常設為 _ 忽略 _ 以下的值。這有助於降低噪音。此值會以虛線顯示在範例圖表上。
最後、您可以設定警示的傳送方法(電子郵件、網路攔截器或兩者)、為監控器提供選擇性的說明或修正動作、並視需要將監控器新增至自訂群組。
以有意義的名稱儲存顯示器、就能完成。
建立之後、監視器會分析上週的資料、以建立初始基準線。異常偵測會隨著時間流逝而變得更準確、而且會發生更多歷史記錄。
檢視異常
在警示登陸頁面上、偵測到異常時觸發的警示會在圖表中顯示反白的頻帶、從度量超出預測範圍的時間到移回這些範圍的時間。
在警示登陸頁面上檢視異常圖表時、您可以選擇下列選項:
-
每週趨勢:將值與前幾週同一時間(同一天)進行比較、最多可達前 5 週。
-
完整異常界限:根據預設、圖表會將重點放在度量值、以便更有效地分析度量行為。選取以顯示完整的異常範圍(最大值等)
您也可以在登陸頁的專家檢視中選取造成異常的物件、以檢視這些物件。圖表會顯示所選物件的行為。