监控 OnCommand Insight 系统运行状况

您应通过查看运行状况页面来定期检查 Insight 系统组件的当前状态,该页面显示了每个组件的状态,并会在出现问题时向您发出警报。

步骤

  1. 登录到 Insight Web UI
  2. 单击 “Admin” ,然后选择 “Health” 。
    此时将显示“Health”页面。
  3. 查看组件的当前状态摘要,尤其要关注 “Details” 列中前面带有红色圆圈的关注状态,它表示存在需要您立即关注的问题。
    Health页面可根据您的系统配置显示下列任意或所有 Insight 组件的相关信息:
    组件 测试 详细信息 显示
    采集 清单数据处理 本地采集单元的状态 如果并发轮询数据源的数量小于执行池最大值(默认为 30)的 75%,则显示“OK”

    如果使用率大于 75%,则显示“Acquisition is busy”,并建议增大轮询时间间隔或添加更多的远程采集单元。

    异常检测引擎 引擎容量 要为检测异常状况而监控的应用程序数量 在 48 个可能的应用程序中,正在受监控的应用程序的数量和所占百分比。
    异常检测引擎 引擎状态 异常检测引擎的状态 如果没有检测到错误,则显示“OK”,否则,显示有关找到的所有错误的信息。

    有关详细信息,请参见 prelert.log 文件。

    DWH 备份 数据仓库计划备份的状态 “OK”以及上次成功备份 DWH 的时间(如果已启用 DWH 计划备份)。

    否则,显示有关找到的所有错误的信息。

    DWH ETL 数据仓库 ETL 的状态 “OK”以及上次成功构建 DWH 的时间(如果没有错误)。

    否则,显示有关找到的所有错误的信息。

    服务器 ASUP ASUP 的状态 “ASUP Enabled”以及上次成功自动通报的时间(如果可用)。

    如果已启用自动通报,但遇到了问题,则显示“ASUP Failed”

    如果备份目录无效,则显示“Invalid backup location”。

    显示上次成功自动通报的时间以及上次尝试失败的时间(如果可用)。

    如果禁用了自动通报,则显示“ASUP Disabled”

    服务器 自动解析 设备自动解析的状态 如果没有错误,则显示“OK”

    如果因标识错误而阻碍了解析进度,则显示“Auto resolution is blocked”

    如果可以识别的通用设备数小于 75%,则显示“Low success rate”

    服务器 弹性搜索 弹性搜索数据存储的状态 如果没有错误,则显示“OK”

    如果无法连接到弹性搜索服务,则显示“Service unavailable”

    如果检测到多个节点,则显示“Cluster mode detected”。

    如果堆占用的空间超过 85%,则显示“High memory utilization”。

    “Status: RED”表示弹性搜索报告的错误。显示有关该错误的信息,并建议联系客户支持。

    服务器 CPU Insight CPU 使用情况 如果 CPU 负载小于 65%,则显示“OK”。如果 CPU 负载大于 65%,则显示

    “System CPU load is high. Reduce your CPU load.”

    服务器 磁盘空间 磁盘空间的状态 可用磁盘空间、Insight 使用的磁盘空间以及建议为 Insight 预留的磁盘空间。

    如果磁盘利用率超过 80%,则显示“Low Disk Space”

    服务器 EventBus EventBus 的状态 “EventBus is empty”;否则将显示 EventBus 队列的状态。
    服务器 清单数据处理 Insight 服务器清单数据处理功能的状态 如果 Insight 服务器不忙,则显示“OK”

    如果服务器在最后一个小时中至少有 75% 的时间处于繁忙状态,则显示“Server is busy”。建议不要添加较多的数据源,请将环境拆分为多个服务器。

    服务器 MySQL MySQL 数据库的状态 如果未检测到问题,则显示“OK”。如果较慢的查询数超过 5%,则显示

    “The database is having performance issues. Some queries are taking too long to run”。如果错误日志增加到超过 20 KB,则显示

    “The database log file grew more than <size> in the past hour. Check MySQL log file”

    服务器 性能归档 性能归档的状态 “Performance archive is enabled”“Performance archive is not enabled”
    服务器 物理内存 物理内存的状态 如果内存使用率小于 85%,则显示“OK”。如果内存使用率大于 85%,则显示

    “Memory usage is high. Reduce your overall memory footprint for system stability”

    服务器 补丁包 补丁包的可用性 显示 Insight 是否有补丁包。如果有补丁包,则显示相关说明。
    服务器 使用情况信息 发送使用情况信息的状态 显示是否已启用向 NetApp 发送使用情况信息的功能。如果未启用,建议启用它。

    显示最后一次尝试发送的时间或最后一次成功发送的时间。

    显示有关遇到的任何问题的信息。

    服务器 违规 未处理的违规的状态 如果未处理的违规数量小于违规限制的 75%,则显示“OK”

    如果未处理的违规数量超过违规限制的 75%,则显示“Maximum number of open violations allowed is <number>”。建议您查看性能策略配置。

    如果未处理的违规数量达到违规限制,则显示“Violation manager is blocked”

    请注意,违规管理器无法创建新违规,建议您查看性能策略配置。

    服务器 每周备份 每周备份的状态 如果启用了每周备份,则显示“OK”,否则,显示“Weekly backup is not enabled”
    注:如果异常检测引擎显示错误,请参见位于以下位置的 prelert.log 文件以了解详细信息:
    • Windows: disk drive:\install directory\SANscreen\Wildfly\Standalone\Logs
    • Linux: /var/log/netapp/oci/wildfly/