Skip to main content
Data Infrastructure Insights
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

监控基础设施健康状况

贡献者 netapp-alavoie

Data Infrastructure Insights提供全面的基础设施健康监控,可跟踪存储环境的性能、容量、配置和组件状态。健康分数是根据这些类别的监控警报计算得出的,为您提供系统健康状况的统一视图并实现主动解决问题。

基础设施健康仪表板

备注 监控基础设施健康状况"预览"功能,并且可能会发生变化。

导航到*可观察性>分析*并选择*基础设施健康*。仪表板根据如下所述的监控警报类别和分数提供系统健康状况的概述。在顶部设置过滤器以缩小调查范围。

基础设施健康概览

默认情况下,健康分数按数据中心分组;您可以选择最适合您的会话的分组。

配置用于监控基础设施健康状况的监视器

健康分数由配置为纳入系统健康计算的警报驱动。

为基础设施对象创建监视器时,您可以选择是否在计算中包含来自监视器的警报。在屏幕底部,展开高级配置并选择_包含在基础设施健康计算中_。选择要应用监视器计算的类别:

  • 组件健康 - 风扇故障、服务处理器离线等。

  • 性能健康 - 存储节点利用率高、节点延迟异常飙升等。

  • 容量健康 - 存储池容量接近满,LUN 快照空间不足等。

  • 配置健康 - 云层无法访问、 SnapMirror关系不同步等。

监控高级配置以添加到健康计算,宽度=400

健康评分解释

分数以 0 到 100 的等级显示,其中 100 表示完全健康。当前或最近遇到问题的受监控基础设施对象将根据以下加权平均值降低此分数:

  • 组件、性能或容量:各占 30%

  • 配置:10%

健康评分会受到您配置为包含在基础设施健康计算中的监视器生成的警报的影响,影响方式如下:

  • 严重警报会使健康评分下降_full_类别权重

  • 警告警报会使类别权重的分数下降一半。

如果任何类别未报告,加权平均值将相应调整。

例如:组件上的 1 个严重警报 (-30) 和性能上的 1 个警告警报 (30 的 50% = -15) 产生的健康评分为 55(100 减 45)。

当警报得到解决时,这些健康分数的降低会逐渐消失,并且分数会在 2 小时内完全恢复。