Skip to main content
Data Infrastructure Insights
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

監控基礎設施健康狀況

貢獻者 netapp-alavoie

Data Infrastructure Insights提供全面的基礎設施健康監控,可追蹤儲存環境的效能、容量、配置和元件狀態。健康分數是根據這些類別的監控警報計算得出的,為您提供系統健康狀況的統一視圖並實現主動解決問題。

基礎設施健康儀表板

註 監控基礎設施健康狀況"預覽"功能,並且可能會發生變化。

導航至*可觀察性>分析*並選擇*基礎設施健康*。儀表板根據如下所述的監控警報類別和分數提供系統健康狀況的概述。在頂部設置過濾器以縮小調查範圍。

基礎設施健康概覽

預設情況下,健康分數會按資料中心分組;您可以選擇最適合您的會話的分組。

配置用於監控基礎設施健康狀況的監視器

健康分數由配置為納入系統健康計算的警報驅動。

為基礎設施物件建立監視器時,您可以選擇是否在計算中包含來自監視器的警報。在螢幕底部,展開進階配置並選擇_包含在基礎設施健康計算中_。選擇要套用監視器計算的類別:

  • 組件健康 - 風扇故障、服務處理器離線等。

  • 效能健康 - 儲存節點利用率高、節點延遲異常飆升等。

  • 容量健康 - 儲存池容量接近滿,LUN 快照空間不足等。

  • 配置健康 - 雲層無法存取、 SnapMirror關係不同步等。

監控高級配置以添加到健康計算,寬度=400

健康評分解釋

分數以 0 到 100 的等級顯示,其中 100 表示完全健康。目前或最近遇到問題的受監控基礎設施物件將根據以下加權平均值降低此分數:

  • 組件、性能或容量:各佔 30%

  • 配置:10%

健康評分會受到您配置為包含在基礎設施健康計算中的監視器產生的警報的影響,影響方式如下:

  • 嚴重警報會使健康評分下降_full_類別權重

  • 警告警報會使類別權重的分數下降一半。

如果任何類別未報告,加權平均值將相應調整。

例如:組件上的 1 個嚴重警報 (-30) 和性能上的 1 個警告警報 (30 的 50% = -15) 產生的健康評分為 55(100 減 45)。

當警報得到解決時,這些健康分數的降低會逐漸消失,並且分數會在 2 小時內完全恢復。