警报

警报是指集群故障或错误,在发生此类故障或错误时会予以报告。警报可以是信息、警告或错误,可以有效地指示集群的运行状况。系统会自动解决大多数错误,但某些错误可能需要手动干预。

您可以通过 “NetApp Element Management” 扩展点的 “Reporting” 选项卡中的 “Alerts” 页面查看有关各个系统警报的信息。

在系统解决了某个警报之后,有关此警报的所有信息(包括解决日期)会移至 “Resolved” 视图中。

以下列表介绍了此页面上的各个列。

ID
集群警报的唯一 ID。
Severity
  • warning:可能需要立即引起注意的次要问题。在此严重性级别下,仍然允许系统升级。
  • error:可能造成性能下降或失去高可用性 (HA) 的故障。错误一般不应在其他方面影响服务。
  • critical:影响服务的严重故障。系统无法处理 API 或客户端 I/O 请求。在此状态下操作可能导致丢失数据。
  • bestPractice:未使用建议的系统配置最佳实践。
Type
  • node:影响整个节点的故障。
  • drive:影响单个驱动器的故障。
  • cluster:影响整个集群的故障。
  • service:影响集群上某个服务的故障。
  • volume:影响集群上某个卷的故障。
Node

与此故障关联的节点的节点 ID。“node”和“drive”故障会提供此信息,其他故障则会设置为 -(短划线)。

Drive ID
与此故障关联的驱动器的驱动器 ID。“drive”故障会提供此信息息,其他故障则会设置为 -(短划线)。
Error Code
指示故障原因的描述性代码。
Details
故障的详细说明。
Time
只有 “Active” 筛选视图才会显示此标题。记录故障的日期和时间。
Resolution Date
只有 “Resolved” 筛选视图才会显示此标题。解决故障的日期和时间。