警报是指集群故障或错误,在发生此类故障或错误时会予以报告。警报可以是信息、警告或错误,可以有效地指示集群的运行状况。系统会自动解决大多数错误,但某些错误可能需要手动干预。
您可以通过
NetApp Element Management扩展点的
Reporting选项卡中的
Alerts页面查看有关各个系统警报的信息。
在系统解决了某个警报之后,有关此警报的所有信息(包括解决日期)会移至Resolved视图中。
以下列表介绍了此页面上的各个列。
- ID
- 集群警报的唯一 ID。
- Severity
- warning:可能需要立即引起注意的次要问题。在此严重性级别下,仍然允许系统升级。
- error:可能造成性能下降或失去高可用性 (HA) 的故障。错误一般不应在其他方面影响服务。
- critical:影响服务的严重故障。系统无法处理 API 或客户端 I/O 请求。在此状态下操作可能导致丢失数据。
- bestPractice:未使用建议的系统配置最佳实践。
- Type
- node:影响整个节点的故障。
- drive:影响单个驱动器的故障。
- cluster:影响整个集群的故障。
- service:影响集群上某个服务的故障。
- volume:影响集群上某个卷的故障。
- Node
与此故障关联的节点的节点 ID。“node”和“drive”故障会提供此信息,其他故障则会设置为 -(短划线)。
- Drive ID
- 与此故障关联的驱动器的驱动器 ID。“drive”故障会提供此信息息,其他故障则会设置为 -(短划线)。
- Error Code
- 指示故障原因的描述性代码。
- Details
- 故障的详细说明。
- Time
- 只有Active筛选视图才会显示此标题。记录故障的日期和时间。
- Resolution Date
- 只有Resolved筛选视图才会显示此标题。解决故障的日期和时间。