系统监控和故障排除
您必须对系统进行监控,以便进行诊断或获取有关各个系统操作的性能趋势和状态信息。出于维护目的,您可能需要更换节点或 SSD。
查看有关系统事件的信息
您可以查看有关在系统中检测到的各种事件的信息。系统会每 30 秒刷新一次事件消息。事件日志可显示集群中的重要事件。
查看正在运行的任务状态
您可以在 Web UI 中查看正在运行的任务的进度和完成状态,此信息由
ListSyncJobs
和
ListBulkVolumeJobs
API 方法报告。您可以从 Element UI 的
“Reporting”
选项卡中访问
“Running Tasks”
页面。
查看系统警报
您可以查看相关警报以了解系统中的集群故障或错误信息。警报可以是信息、警告或错误,可以有效地指示集群的运行状况。大多数错误可以自行解决。
查看节点性能活动
您可以通过图形格式查看每个节点的性能活动。这些信息提供了有关每个节点的 CPU 和每秒读/写 I/O 操作数 (IOPS) 的实时统计信息。利用率图形每 5 秒钟更新一次,驱动器统计信息图形每 10 秒钟更新一次。
查看卷性能
您可以查看集群中所有卷的详细性能信息。您可以按卷 ID 或任何性能列排序信息。此外,还可以按某个条件对信息进行筛选。
查看 iSCSI 会话
您可以查看连接到集群的 iSCSI 会话。您可以对信息进行筛选,以便仅显示所需的会话。
查看光纤通道会话
您可以查看连接到集群的光纤通道 (FC) 会话。您可以对信息进行筛选,以便仅显示您希望在此窗口中显示的连接。
驱动器故障排除
您可以使用替代驱动器更换出现故障的固态驱动器 (Solid State Drive, SSD)。SolidFire 存储节点的 SSD 可热插拔。如果您怀疑 SSD 出现故障,请联系 NetApp 支持部门,以确认此故障并指导您执行正确的解决步骤。同时,NetApp 支持部门还会与您配合,根据您的服务级别协议获取一个替代驱动器。
节点故障排除
您可以从集群中删除节点,以便进行维护或更换。您应先使用
NetApp
Element UI 或 API 删除节点,然后再使其脱机。
使用用于存储节点的每个节点实用程序
如果 NetApp Element 软件 UI 中的标准监控工具没有为
NetApp Element 软件
、您可以使用每个节点的实用程序来排除网络问题。每个节点的公用程序提供了特定的信息和工具、可以帮助您解决节点之间或管理节点之间的网络问题。
使用管理节点
您可以使用管理节点 (mNode) 升级系统服务、管理集群资产和设置、运行系统测试和实用程序、配置 Active IQ 以进行系统监控以及启用 NetApp 支持访问以进行故障排除。
了解集群填充度级别
运行 Element 软件的集群可生成集群故障,以便在集群容量即将用完时向存储管理员发出警告。集群填充度分为三个级别(即警告、错误和严重),所有这些级别均会显示在
NetApp
Element UI 中。
相关概念
驱动器故障排除
节点故障排除
使用用于存储节点的每个节点实用程序
使用管理节点
了解集群填充度级别
相关任务
查看有关系统事件的信息
查看系统警报
查看节点性能活动
查看卷性能
查看 iSCSI 会话
查看光纤通道会话
在集群上为 HTTPS 启用 FIPS 140-2
相关参考
查看正在运行的任务状态