Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

在 EDA 工作负载中使用概览仪表板

贡献者 netapp-sineadd

作为管理跨多个 FSx for ONTAP 文件系统(ONTAP 群集)的 EDA 工作负载的 IT 管理员,您可以使用概述仪表板快速评估群集健康状况和使用情况。使用它来决定在哪里放置新的卷或作业,确定移动卷或 SVM 的候选对象,并确定何时扩展容量或吞吐量。

概述

概览仪表板为您的 FSx for ONTAP 集群提供了集中视图,包括容量和吞吐量。使用它来放置新卷、重新平衡工作负载并规划容量或吞吐量扩展。

控制面板包括:

  • 集群运行状况状态:在信息中心顶部汇总的信息,突出显示整个文件系统的延迟事件、SSD 利用率和容量建议以及 ONTAP EMS 事件。

  • 集群表:详细的可搜索表,显示每个集群的使用情况和性能指标,支持过滤、排序、分页和 CSV 导出。

要求

使用控制面板之前,请确保满足以下要求:

具有查看权限的 AWS 凭据

您必须至少使用常规存储的读取(查看)权限在 Workload Factory 中配置 AWS 凭据。不支持 Basic 凭据。

如果您尚未配置具有查看权限的凭据,则在打开"概述"选项卡时将重定向到 AWS 凭据设置页面。

如果您尚未配置 AWS 凭据,请参见 "添加 AWS 凭据"

激活信息板

在 Workload Factory 确认具有查看权限的凭据后,您必须激活仪表板,以开始为 FSx for ONTAP 文件系统收集 CloudWatch 指标。

备注 在您提供同意后,收集指标可能需要一些时间。正在进行初始收集时,仪表板会通知您。
步骤
  1. 使用以下任一方式登录 "主机体验"

  2. 选择菜单 汉堡菜单图标,然后选择 EDA

  3. 选择 Overview 选项卡。

  4. 如果未检测到具有查看权限的凭据,请选择 Add credentials 并按照提示使用查看权限配置 AWS 凭据。然后返回 Overview 选项卡。

  5. 查看同意提示,说明将为您的 FSx for ONTAP 文件系统收集的 CloudWatch 指标。

  6. 选择 Activate 以激活仪表板并开始收集指标。

结果

Workload Factory 开始收集与您配置的 AWS 凭据相关联的所有 FSx for ONTAP 文件系统的 CloudWatch 指标。当指标可用时,控制面板会填充。如果收集仍在进行中,则会显示通知。

筛选仪表板

使用仪表板顶端的筛选器将重点放在特定的文件系统上。这些筛选器适用于延迟、利用率和 ONTAP 事件部分以及群集表。

可用筛选器:

  • 区域:按一个或多个 AWS 区域进行筛选。

  • AWS 账户:按与您配置的凭据关联的一个或多个 AWS 账户进行筛选。

更新筛选器选择时,将刷新所有信息以仅显示匹配的文件系统。

集群运行状况状态

在控制面板的顶端,会显示已过滤文件系统的运行状况和活动的快照。仅当至少一个 FSx for ONTAP 链接与您的文件系统相关联时,才会显示此信息。如果没有可用的链接,信息将被隐藏。

  • 延迟:显示在范围内跨文件系统检测到的延迟事件数。

  • 利用率:显示 SSD 利用率状态并标识具有活动容量建议的文件系统。

  • ONTAP 事件:显示检测到的 EMS 事件数量,按容量、可用性和保护以及安全性和其他分类。

延迟

显示在范围内的文件系统中检测到的延迟事件数。

  • 当您选择 Review 时,将显示 Latency 选项卡。

  • 仅当启用了延迟监控时,才能查看延迟信息。如果您尚未配置延迟阈值,请选择 Configure。有关延迟监控的详细信息,请参阅 "FSx 延迟分析"

利用率

显示范围内至少有一个集群的 SSD 使用率超过 80% 的文件系统数量,以及具有活动容量建议的文件系统数量。这有助于您快速识别可能需要注意容量的文件系统。

容量建议

Workload Factory 会自动为您的 EDA 库存中可见的每个 FSx for ONTAP 文件系统运行容量推荐算法。该算法每 24 小时扫描一次,并确定何时建议调整 SSD 容量。

确定建议后:

  • 根据您的 Workload Factory 通知设置,您将收到即时通知(电子邮件或 WAD)。在确定建议后立即发送通知,而不是等待每周摘要。

  • 对于具有活动推荐的任何文件系统,Clusters 表行中都会显示灯泡指示器。

  • 此时将显示具有活动建议的文件系统的总数。这可确保建议可见,即使受影响的文件系统不在表的第一页。

查看和应用容量建议

步骤
  1. 使用以下任一方式登录 "主机体验"

  2. 选择菜单 汉堡菜单图标,然后选择 EDA

  3. 选择 Overview 选项卡。

  4. Clusters 表中,找到带有灯泡指示器的文件系统。

    将鼠标悬停在灯泡指示器上可查看包含建议简要说明的工具提示。

  5. 在表中选择集群名称以打开它并查看建议。

  6. 查看 SSD 建议和容量图。

    该建议解释了建议的变更及其背后的原因。例如:我们建议根据您的文件系统 SSD 使用模式增加 SSD 大小。

    该图表显示了当前 SSD 使用情况以及历史趋势,并显示了容量推荐算法如何随时间调整容量。

  7. 在图表的右上角,选择时间范围以更改显示的时间段。默认值为一周。

ONTAP 事件

显示在范围内跨文件系统检测到的 EMS 事件数量,按容量、可用性和保护以及安全与其他分类。

容量

显示与容量问题相关的 EMS 消息的数量,以及受影响的文件系统的数量。

监测的 EMS 事件示例包括:

  • 聚合接近全满/全满

  • 卷接近全满/全满

  • Snapshot 预留接近全满/全满

  • 目录大小已满

  • FlexGroup 已满

  • 索引节点已满

有关监测的 EMS 事件的完整列表,请参见 "容量事件"

选择 Capacity 将导航到 Storage workloads 中的容量分析屏幕。

可用性和保护

显示与可用性和数据保护相关的 EMS 消息数量,以及受影响的文件系统数量。

监测到的事件包括 FlexCache 和 SnapMirror 相关的 EMS 事件。

选择 Availability & protection 将导航到 Storage workloads 中的可用性和保护分析屏幕。

安全及其他

显示未归类为"容量"或"可用性和保护"的事件的 EMS 消息数量,以及受影响的文件系统数量。监控的事件包括反勒索软件保护、NFS 身份验证失败等。

选择 Security & other 将导航到 Storage workloads 中的事件分析屏幕。

Clusters 表

提供与您配置的 AWS 凭据相关联的每个 FSx for ONTAP 文件系统的详细视图,按活动区域和 AWS 账户选择进行筛选。数据是从 CloudWatch 指标中收集的。该表支持搜索、列筛选、分页、列自定义和 CSV 导出。

关键指标包括:

  • 名称、区域和 AWS 帐户

  • SSD 容量指标(已使用、总计和使用百分比)

  • 容量池存储

  • 吞吐量指标(过去 30 天的平均值、P95、P99 和最大值)

使用 SSD 使用情况 来识别接近容量限制的文件系统。使用 吞吐量使用率 (P99) 将吞吐量需求与配置的吞吐量 SKU 进行比较。将鼠标悬停在吞吐量列标题上以获取计算详细信息。

搜索和筛选

  • 使用搜索按名称、文件系统 ID、区域或其他属性查找特定群集。

  • 选择任何列标题以按该列对表进行排序。

  • 使用每列筛选器控件来缩小表中的结果。

  • 表格已分页。使用表格底部的分页控件在页面之间导航。

备注 具有活动容量建议的文件系统在表中显示灯泡指示器。选择任何文件系统名称以查看该文件系统的 SSD 容量指标、历史使用趋势和容量建议。

自定义列

从集群表中添加或删除列:

  1. 选择右侧表格上方的列选择器图标。

  2. 选择或取消选择要显示或隐藏的列。

  3. 选择*应用*。

将表导出为 CSV

您可以将当前显示的表数据导出为 CSV 文件,以进行进一步分析或报告。

  1. 应用要反映在导出中的任何筛选器或列自定义项。

  2. 选择集群表上方的 下载 按钮。

CSV 文件已下载,其中包含表中当前可见的所有行,仅包括当前显示的列。