使用 Workload Factory 中的 Overview 仪表板进行 EDA
使用概览仪表板监控整个 FSx for ONTAP 文件系统的集群运行状况和容量。筛选数据、查看容量建议、管理 SSD 容量设置并分析性能趋势,以便就卷放置和容量扩展做出明智的决策。
开始之前
您必须具有 "已激活 Overview dashboard",然后才能使用它来监控文件系统。
筛选仪表板
使用仪表板顶端的筛选器将重点放在特定的文件系统上。这些筛选器适用于延迟、利用率和 ONTAP 事件部分以及群集表。
-
使用以下任一方式登录 "主机体验"。
-
选择菜单
,然后选择 EDA。 -
选择 Overview 选项卡。
-
使用可用的筛选器来缩小视图范围:
-
AWS 账户:按与您配置的凭据关联的一个或多个 AWS 账户进行筛选
-
凭据:如果配置了多个 AWS 凭据,请按特定 AWS 凭据进行筛选
-
区域:按一个或多个 AWS 区域筛选
-
-
更新筛选器选择时,将刷新所有信息以仅显示匹配的文件系统。
查看集群运行状况状态
在控制面板的顶端,会显示已过滤文件系统的运行状况和活动的快照。仅当至少一个 FSx for ONTAP 链接与您的文件系统相关联时,才会显示此信息。
集群运行状况状态包括以下关键领域:
-
延迟:检测到的延迟事件数量
-
SSD 容量模式:SSD 利用率状态和具有活动容量建议的文件系统
-
ONTAP 事件:按类别(容量、可用性和保护、安全性和其他)划分的 EMS 事件数量
-
查看控制面板顶部的集群运行状况状态。
-
要查看延迟事件:
-
选择 Review 以导航到 Latency 选项卡
-
如果未配置延迟监控,请选择 Configure 设置延迟阈值
有关延迟监控的详细信息,请参阅 "配置延迟监控"。
-
-
要查看 FSx for ONTAP 文件系统的 ONTAP 事件,请选择*查看*。
ONTAP 事件视图卡按类别(容量、可用性和保护以及安全性和其他)显示 EMS 事件的数量。有关监测的 EMS 事件的完整列表,请参见 "ONTAP CLI 文档"。
查看和应用容量建议
Workload Factory 自动为每个 FSx for ONTAP 文件系统运行容量推荐算法。您可以通过筛选 Clusters 表来识别具有容量建议的文件系统。
-
在 Clusters 表中,按 Last SSD increase timestamp 或 Last SSD increase description 列进行筛选。
包含容量建议的文件系统显示在表格顶端。
-
在表格中选择一个文件系统名称以打开它并查看建议。
-
查看 SSD 建议和容量图。
该建议解释了建议的变更及其背后的原因。例如:我们建议根据您的文件系统 SSD 使用模式增加 SSD 大小。
该图表显示了当前 SSD 使用情况以及历史趋势,并显示了容量推荐算法如何随时间调整容量。
-
在图表的右上角,选择时间范围以更改显示的时间段。默认值为一周。
该图还显示推荐决策点和自动化决策点(如果启用了自动化模式)。将鼠标悬停在任何决策点上,以查看此时有关容量建议或自动化操作的详细信息。
-
要应用推荐,请按照推荐消息中提供的指导进行操作。
更改 SSD 管理模式
更改单个文件系统的 SSD 容量管理模式,以控制是否需要手动建议或自动扩展容量。
SSD 管理模式包括:
-
自动:根据预定义的阈值自动增加 SSD 容量
-
推荐:接收您手动查看和应用的容量建议
-
None:无容量建议或自动操作
如果选择 Automate 模式,则可以配置 Threshold、Lookback 和 Ahead 参数,以控制容量管理系统如何分析 SSD 使用情况并做出自动化决策。如果选择 Recommend 模式,则只能配置 Threshold 参数。
-
阈值 (10-90%):触发容量建议或自动化操作的 SSD 使用百分比
-
Lookback (1-200 小时):用于分析历史 SSD 使用模式的时间段
-
提前 (1-200 小时):用于预测未来产能需求的时间段
-
在 Clusters 表中找到文件系统名称。在其旁边,打开
并选择 更改 SSD 容量管理。 -
选择您的首选模式:
-
None:禁用容量管理
-
推荐:为推荐分析设置 Threshold 参数
-
Automate:为自动容量扩展设置 Threshold、Lookback 和 Ahead 参数
-
-
选择*应用*。
文件系统立即使用新模式。如果选择"推荐"或"自动化",系统将使用配置的参数进行容量分析和决策。
批量编辑 SSD 管理参数
同时调整多个文件系统的 SSD 容量管理参数,以在群集中应用一致的设置。
选择多个文件系统进行批量编辑时:
-
如果所有选定的文件系统具有相同的参数值,则这些值在编辑对话框中显示为默认值
-
如果任何选定的文件系统处于 None 模式,则在对话框中填充默认值
-
如果所选文件系统的参数值不同,则在对话框中填充默认值
-
从 概述 选项卡中,选择要在表中编辑的文件系统。
您可以选择单个文件系统,也可以使用标题复选框来选择所有可见的文件系统。 -
选择表上方的 Change SSD capacity management。
-
选择您的首选模式。
-
在编辑对话框中,根据需要调整阈值、回溯和前进参数。
每个参数字段都包含一个工具提示,描述其目的和有效范围。该对话框根据您的选择显示当前值或默认值。
-
选择 Apply 将更改应用于所有选定的文件系统。
将更新所有选定文件系统的参数。处于 Recommend 或 Automate 模式的文件系统会立即使用新参数进行容量分析和决策。
分析容量趋势和决策点
使用 SSD 使用情况图表来了解容量行为随时间的变化,并识别容量管理模式。
图表上的决策点表示何时:
-
推荐决策点:容量推荐算法确定需要额外的 SSD 容量。如果 SSD 容量没有增加,这种情况可能每 30 分钟发生一次。
-
自动化决策点:自动化系统试图增加 SSD 容量。这些点指示操作是成功还是失败。
-
在 概述 选项卡中,在表中选择一个文件系统名称。
-
查看显示历史容量趋势的 SSD 使用情况图。
-
选择不同的时间范围以查看不同时期的容量行为。
-
将鼠标悬停在图表上的决策点上,可查看特定时刻的建议或自动化操作的详细信息。
-
使用图表中的见解:
-
了解需要调整容量的频率
-
评估自动化或推荐模式是否更适合您的工作负载模式
-
识别重复性容量限制
-
根据增长趋势规划未来的容量需求
-
对失败的自动化尝试进行故障排除
-
使用集群表
clusters 表提供了每个 FSx for ONTAP 文件系统的详细视图以及性能和使用指标。
-
在 概述 选项卡中,查看集群表。
-
使用搜索框按名称查找特定文件系统。
-
选择列标题以对数据进行排序。
-
使用 SSD 使用情况 来识别接近容量限制的文件系统。
-
使用 吞吐量使用率 (P99) 将吞吐量需求与配置的吞吐量 SKU 进行比较。
将鼠标悬停在吞吐量列标题上以获取计算详细信息。
-
要自定义列,请选择列设置图标并选择要显示的列。
-
要导出数据,请选择导出图标以下载 CSV 文件。
-
要执行批量操作,请使用复选框选择多个文件系统,然后选择 编辑参数。
最佳实践
使用概览控制面板时,请考虑以下建议:
-
定期监控:定期检查仪表板,以便在趋势成为问题之前识别它们。
-
设置适当的阈值:根据您的工作负载模式和容量规划偏好配置 SSD 管理阈值。
-
有效使用过滤器:将区域和帐户过滤器组合起来,专注于基础设施的特定子集。
-
及时查看建议:按上次 SSD 增加时间戳或描述过滤集群表,以识别具有容量建议的文件系统。审查这些建议并采取行动,以防止容量限制。
-
选择正确的模式:当您想要控制容量决策时,请使用 Recommend 模式,或者使用 Automation 模式进行免提管理。
-
监控决策点:定期查看容量图上的决策点,以了解算法行为,并验证设置是否符合您的需求。
-
利用批量编辑:管理多个文件系统时,使用批量参数编辑来维护一致的容量管理策略。