Skip to main content
Data Infrastructure Insights
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

異常狀況偵測監視器

貢獻者

異常狀況偵測可深入瞭解租戶資料模式的非預期變更。當物件的行為模式發生變化時,就會發生異常,例如,如果物件在每週三的某個時間發生某種延遲層級,但在接下來的星期三,延遲會在該層級以上時尖峰,這種尖峰會被視為異常。Data Infrastructure Insights 可讓您建立監控器、以便在發生這類異常時發出警示。

異常狀況偵測適用於呈現週期性、可預測模式的物件指標。當這些物件指標高出或低於預期層級時、 Data Infrastructure Insights 會產生警示、以提示調查。

顯示偵測到異常的圖表

什麼是異常偵測?

當計量的平均值與前幾週的加權平均值有許多標準偏差、而最近幾週的加權平均值比前幾週的加權值更高時、就會發生異常。Data Infrastructure Insights 可在偵測到異常時監控資料和警示。您可以選擇設定偵測的「敏感度」等級。例如、當平均值與平均值的標準差較少時、敏感度會較高、因此會產生更多警示。相反地、較低的靈敏度 = 較低的平均偏差 = 較少的警示。

異常偵測監控與臨界值監控不同。

  • * 臨界值型監控 * 可在您有特定度量的預先定義臨界值時運作。換句話說、當您清楚瞭解預期的內容時(即在正常範圍內)。

當您知道作業範圍時、「度量監視器」就適用於您

  • * 異常偵測監控 * 使用機器學習演算法來識別偏離規範的異常值、因為「正常」的定義不清楚。

異常狀況偵測監視器適用於您想知道尖峰或掉落的時機

我何時需要 Anomaly 偵測?

異常狀況偵測監控可針對許多情況提供實用的警示、包括:

  • normal 的定義不明確時。例如、 SAN 錯誤率可能會因連接埠而有所不同。警示某個錯誤是很吵且不必要的、但突然或大幅增加可能表示問題很普遍。

  • 隨著時間的變化。工作負載呈現季節性(亦即在特定時間、工作負載忙碌或安靜)。這可能包括非預期的靜止期間、可能表示批次檔位。

  • 在手動定義和調整臨界值不切實際的情況下、處理大量資料。例如,擁有大量主機和(或)磁碟區且工作負載各異的租戶。每個 SLA 都可能有不同的 SLA 、因此瞭解超出規範的 SLA 非常重要。

建立異常偵測監視器

若要警示異常狀況、請瀏覽 * 可服務性 > 警示 > +Monitor* 來建立監視器。選取 _ Anomaly Detection Monitor_ 作為監視器類型。

建立監視器時選取異常偵測、寬度 =480

選擇您要監控的物件和度量。您可以像設定其他類型的監視器一樣、設定篩選器和群組。

接著、設定監視器的條件。

  • 當所選的度量超過預測範圍 _ 時觸發警示、 _ 低於 _ 這些範圍、或同時低於兩者。

  • 將敏感度設為 Medium 、 _Low (偵測到的異常狀況較少)或 High (偵測到的異常狀況較多)。

  • 判斷警示層級是 _ 重大 _ 還是 _ 警告 _ 。

  • 您也可以選擇將異常設為 _ 忽略 _ 以下的值。這有助於降低噪音。此值會以虛線顯示在範例圖表上。

設定異常偵測監視器的條件

最後、您可以設定警示的傳送方法(電子郵件、網路攔截器或兩者)、為監控器提供選擇性的說明或修正動作、並視需要將監控器新增至自訂群組。

以有意義的名稱儲存顯示器、就能完成。

建立之後、監視器會分析上週的資料、以建立初始基準線。異常偵測會隨著時間流逝而變得更準確、而且會發生更多歷史記錄。

檢視異常

在警示登陸頁面上、偵測到異常時觸發的警示會在圖表中顯示反白的頻帶、從度量超出預測範圍的時間到移回這些範圍的時間。

顯示異常發生時間的圖表

在警示登陸頁面上檢視異常圖表時、您可以選擇下列選項:

  • 每週趨勢:將值與前幾週同一時間(同一天)進行比較、最多可達前 5 週。

  • 完整異常界限:根據預設、圖表會將重點放在度量值、以便更有效地分析度量行為。選取以顯示完整的異常範圍(最大值等)

您也可以在登陸頁的專家檢視中選取造成異常的物件、以檢視這些物件。圖表會顯示所選物件的行為。

記錄造成異常的物件