在 EDA 工作负载中使用概览仪表板
作为管理跨多个 FSx for ONTAP 文件系统(ONTAP 群集)的 EDA 工作负载的 IT 管理员,您可以使用概述仪表板快速评估群集健康状况和使用情况。使用它来决定在哪里放置新的卷或作业,确定移动卷或 SVM 的候选对象,并确定何时扩展容量或吞吐量。
概述
概览仪表板为您的 FSx for ONTAP 集群提供了集中视图,包括容量和吞吐量。使用它来放置新卷、重新平衡工作负载并规划容量或吞吐量扩展。
控制面板包括:
-
集群运行状况状态:在信息中心顶部汇总的信息,突出显示整个文件系统的延迟事件、SSD 利用率和容量建议以及 ONTAP EMS 事件。
-
集群表:详细的可搜索表,显示每个集群的使用情况和性能指标,支持过滤、排序、分页和 CSV 导出。
要求
使用控制面板之前,请确保满足以下要求:
- 具有查看权限的 AWS 凭据
-
您必须至少使用常规存储的读取(查看)权限在 Workload Factory 中配置 AWS 凭据。不支持 Basic 凭据。
如果您尚未配置具有查看权限的凭据,则在打开"概述"选项卡时将重定向到 AWS 凭据设置页面。
如果您尚未配置 AWS 凭据,请参见 "添加 AWS 凭据"。
- 激活信息板
-
在 Workload Factory 确认具有查看权限的凭据后,您必须激活仪表板,以开始为 FSx for ONTAP 文件系统收集 CloudWatch 指标。
|
|
在您提供同意后,收集指标可能需要一些时间。正在进行初始收集时,仪表板会通知您。 |
-
使用以下任一方式登录 "主机体验"。
-
选择菜单
,然后选择 EDA。 -
选择 Overview 选项卡。
-
如果未检测到具有查看权限的凭据,请选择 Add credentials 并按照提示使用查看权限配置 AWS 凭据。然后返回 Overview 选项卡。
-
查看同意提示,说明将为您的 FSx for ONTAP 文件系统收集的 CloudWatch 指标。
-
选择 Activate 以激活仪表板并开始收集指标。
Workload Factory 开始收集与您配置的 AWS 凭据相关联的所有 FSx for ONTAP 文件系统的 CloudWatch 指标。当指标可用时,控制面板会填充。如果收集仍在进行中,则会显示通知。
筛选仪表板
使用仪表板顶端的筛选器将重点放在特定的文件系统上。这些筛选器适用于延迟、利用率和 ONTAP 事件部分以及群集表。
可用筛选器:
-
区域:按一个或多个 AWS 区域进行筛选。
-
AWS 账户:按与您配置的凭据关联的一个或多个 AWS 账户进行筛选。
更新筛选器选择时,将刷新所有信息以仅显示匹配的文件系统。
集群运行状况状态
在控制面板的顶端,会显示已过滤文件系统的运行状况和活动的快照。仅当至少一个 FSx for ONTAP 链接与您的文件系统相关联时,才会显示此信息。如果没有可用的链接,信息将被隐藏。
-
延迟:显示在范围内跨文件系统检测到的延迟事件数。
-
利用率:显示 SSD 利用率状态并标识具有活动容量建议的文件系统。
-
ONTAP 事件:显示检测到的 EMS 事件数量,按容量、可用性和保护以及安全性和其他分类。
延迟
显示在范围内的文件系统中检测到的延迟事件数。
-
当您选择 Review 时,将显示 Latency 选项卡。
-
仅当启用了延迟监控时,才能查看延迟信息。如果您尚未配置延迟阈值,请选择 Configure。有关延迟监控的详细信息,请参阅 "FSx 延迟分析"。
利用率
显示范围内至少有一个集群的 SSD 使用率超过 80% 的文件系统数量,以及具有活动容量建议的文件系统数量。这有助于您快速识别可能需要注意容量的文件系统。
容量建议
Workload Factory 会自动为您的 EDA 库存中可见的每个 FSx for ONTAP 文件系统运行容量推荐算法。该算法每 24 小时扫描一次,并确定何时建议调整 SSD 容量。
确定建议后:
-
根据您的 Workload Factory 通知设置,您将收到即时通知(电子邮件或 WAD)。在确定建议后立即发送通知,而不是等待每周摘要。
-
对于具有活动推荐的任何文件系统,Clusters 表行中都会显示灯泡指示器。
-
此时将显示具有活动建议的文件系统的总数。这可确保建议可见,即使受影响的文件系统不在表的第一页。
查看和应用容量建议
-
使用以下任一方式登录 "主机体验"。
-
选择菜单
,然后选择 EDA。 -
选择 Overview 选项卡。
-
在 Clusters 表中,找到带有灯泡指示器的文件系统。
将鼠标悬停在灯泡指示器上可查看包含建议简要说明的工具提示。
-
在表中选择集群名称以打开它并查看建议。
-
查看 SSD 建议和容量图。
该建议解释了建议的变更及其背后的原因。例如:我们建议根据您的文件系统 SSD 使用模式增加 SSD 大小。
该图表显示了当前 SSD 使用情况以及历史趋势,并显示了容量推荐算法如何随时间调整容量。
-
在图表的右上角,选择时间范围以更改显示的时间段。默认值为一周。
ONTAP 事件
显示在范围内跨文件系统检测到的 EMS 事件数量,按容量、可用性和保护以及安全与其他分类。
显示与容量问题相关的 EMS 消息的数量,以及受影响的文件系统的数量。
监测的 EMS 事件示例包括:
-
聚合接近全满/全满
-
卷接近全满/全满
-
Snapshot 预留接近全满/全满
-
目录大小已满
-
FlexGroup 已满
-
索引节点已满
有关监测的 EMS 事件的完整列表,请参见 "容量事件"。
选择 Capacity 将导航到 Storage workloads 中的容量分析屏幕。
显示与可用性和数据保护相关的 EMS 消息数量,以及受影响的文件系统数量。
监测到的事件包括 FlexCache 和 SnapMirror 相关的 EMS 事件。
选择 Availability & protection 将导航到 Storage workloads 中的可用性和保护分析屏幕。
显示未归类为"容量"或"可用性和保护"的事件的 EMS 消息数量,以及受影响的文件系统数量。监控的事件包括反勒索软件保护、NFS 身份验证失败等。
选择 Security & other 将导航到 Storage workloads 中的事件分析屏幕。
Clusters 表
提供与您配置的 AWS 凭据相关联的每个 FSx for ONTAP 文件系统的详细视图,按活动区域和 AWS 账户选择进行筛选。数据是从 CloudWatch 指标中收集的。该表支持搜索、列筛选、分页、列自定义和 CSV 导出。
关键指标包括:
-
名称、区域和 AWS 帐户
-
SSD 容量指标(已使用、总计和使用百分比)
-
容量池存储
-
吞吐量指标(过去 30 天的平均值、P95、P99 和最大值)
使用 SSD 使用情况 来识别接近容量限制的文件系统。使用 吞吐量使用率 (P99) 将吞吐量需求与配置的吞吐量 SKU 进行比较。将鼠标悬停在吞吐量列标题上以获取计算详细信息。
搜索和筛选
-
使用搜索按名称、文件系统 ID、区域或其他属性查找特定群集。
-
选择任何列标题以按该列对表进行排序。
-
使用每列筛选器控件来缩小表中的结果。
-
表格已分页。使用表格底部的分页控件在页面之间导航。
|
|
具有活动容量建议的文件系统在表中显示灯泡指示器。选择任何文件系统名称以查看该文件系统的 SSD 容量指标、历史使用趋势和容量建议。 |
自定义列
从集群表中添加或删除列:
-
选择右侧表格上方的列选择器图标。
-
选择或取消选择要显示或隐藏的列。
-
选择*应用*。
将表导出为 CSV
您可以将当前显示的表数据导出为 CSV 文件,以进行进一步分析或报告。
-
应用要反映在导出中的任何筛选器或列自定义项。
-
选择集群表上方的
按钮。
CSV 文件已下载,其中包含表中当前可见的所有行,仅包括当前显示的列。