Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

使用 Workload Factory 中的 Overview 仪表板进行 EDA

贡献者 netapp-sineadd

使用概览仪表板监控整个 FSx for ONTAP 文件系统的集群运行状况和容量。筛选数据、查看容量建议、管理 SSD 容量设置并分析性能趋势,以便就卷放置和容量扩展做出明智的决策。

开始之前

您必须具有 "已激活 Overview dashboard",然后才能使用它来监控文件系统。

筛选仪表板

使用仪表板顶端的筛选器将重点放在特定的文件系统上。这些筛选器适用于延迟、利用率和 ONTAP 事件部分以及群集表。

步骤
  1. 使用以下任一方式登录 "主机体验"

  2. 选择菜单 汉堡菜单图标,然后选择 EDA

  3. 选择 Overview 选项卡。

  4. 使用可用的筛选器来缩小视图范围:

    • AWS 账户:按与您配置的凭据关联的一个或多个 AWS 账户进行筛选

    • 凭据:如果配置了多个 AWS 凭据,请按特定 AWS 凭据进行筛选

    • 区域:按一个或多个 AWS 区域筛选

  5. 更新筛选器选择时,将刷新所有信息以仅显示匹配的文件系统。

查看集群运行状况状态

在控制面板的顶端,会显示已过滤文件系统的运行状况和活动的快照。仅当至少一个 FSx for ONTAP 链接与您的文件系统相关联时,才会显示此信息。

关于此任务

集群运行状况状态包括以下关键领域:

  • 延迟:检测到的延迟事件数量

  • SSD 容量模式:SSD 利用率状态和具有活动容量建议的文件系统

  • ONTAP 事件:按类别(容量、可用性和保护、安全性和其他)划分的 EMS 事件数量

步骤
  1. 查看控制面板顶部的集群运行状况状态。

  2. 要查看延迟事件:

    • 选择 Review 以导航到 Latency 选项卡

    • 如果未配置延迟监控,请选择 Configure 设置延迟阈值

      有关延迟监控的详细信息,请参阅 "配置延迟监控"

  3. 要查看 FSx for ONTAP 文件系统的 ONTAP 事件,请选择*查看*。

    ONTAP 事件视图卡按类别(容量、可用性和保护以及安全性和其他)显示 EMS 事件的数量。有关监测的 EMS 事件的完整列表,请参见 "ONTAP CLI 文档"

查看和应用容量建议

Workload Factory 自动为每个 FSx for ONTAP 文件系统运行容量推荐算法。您可以通过筛选 Clusters 表来识别具有容量建议的文件系统。

步骤
  1. Clusters 表中,按 Last SSD increase timestampLast SSD increase description 列进行筛选。

    包含容量建议的文件系统显示在表格顶端。

  2. 在表格中选择一个文件系统名称以打开它并查看建议。

  3. 查看 SSD 建议和容量图。

    该建议解释了建议的变更及其背后的原因。例如:我们建议根据您的文件系统 SSD 使用模式增加 SSD 大小。

    该图表显示了当前 SSD 使用情况以及历史趋势,并显示了容量推荐算法如何随时间调整容量。

  4. 在图表的右上角,选择时间范围以更改显示的时间段。默认值为一周。

    该图还显示推荐决策点和自动化决策点(如果启用了自动化模式)。将鼠标悬停在任何决策点上,以查看此时有关容量建议或自动化操作的详细信息。

  5. 要应用推荐,请按照推荐消息中提供的指导进行操作。

更改 SSD 管理模式

更改单个文件系统的 SSD 容量管理模式,以控制是否需要手动建议或自动扩展容量。

关于此任务

SSD 管理模式包括:

  • 自动:根据预定义的阈值自动增加 SSD 容量

  • 推荐:接收您手动查看和应用的容量建议

  • None:无容量建议或自动操作

如果选择 Automate 模式,则可以配置 Threshold、Lookback 和 Ahead 参数,以控制容量管理系统如何分析 SSD 使用情况并做出自动化决策。如果选择 Recommend 模式,则只能配置 Threshold 参数。

  • 阈值 (10-90%):触发容量建议或自动化操作的 SSD 使用百分比

  • Lookback (1-200 小时):用于分析历史 SSD 使用模式的时间段

  • 提前 (1-200 小时):用于预测未来产能需求的时间段

步骤
  1. 在 Clusters 表中找到文件系统名称。在其旁边,打开 操作菜单图标 并选择 更改 SSD 容量管理

  2. 选择您的首选模式:

    • None:禁用容量管理

    • 推荐:为推荐分析设置 Threshold 参数

    • Automate:为自动容量扩展设置 Threshold、Lookback 和 Ahead 参数

  3. 选择*应用*。

结果

文件系统立即使用新模式。如果选择"推荐"或"自动化",系统将使用配置的参数进行容量分析和决策。

批量编辑 SSD 管理参数

同时调整多个文件系统的 SSD 容量管理参数,以在群集中应用一致的设置。

关于此任务

选择多个文件系统进行批量编辑时:

  • 如果所有选定的文件系统具有相同的参数值,则这些值在编辑对话框中显示为默认值

  • 如果任何选定的文件系统处于 None 模式,则在对话框中填充默认值

  • 如果所选文件系统的参数值不同,则在对话框中填充默认值

步骤
  1. 概述 选项卡中,选择要在表中编辑的文件系统。

    提示 您可以选择单个文件系统,也可以使用标题复选框来选择所有可见的文件系统。
  2. 选择表上方的 Change SSD capacity management

  3. 选择您的首选模式。

  4. 在编辑对话框中,根据需要调整阈值、回溯和前进参数。

    每个参数字段都包含一个工具提示,描述其目的和有效范围。该对话框根据您的选择显示当前值或默认值。

  5. 选择 Apply 将更改应用于所有选定的文件系统。

结果

将更新所有选定文件系统的参数。处于 Recommend 或 Automate 模式的文件系统会立即使用新参数进行容量分析和决策。

分析容量趋势和决策点

使用 SSD 使用情况图表来了解容量行为随时间的变化,并识别容量管理模式。

关于此任务

图表上的决策点表示何时:

  • 推荐决策点:容量推荐算法确定需要额外的 SSD 容量。如果 SSD 容量没有增加,这种情况可能每 30 分钟发生一次。

  • 自动化决策点:自动化系统试图增加 SSD 容量。这些点指示操作是成功还是失败。

步骤
  1. 概述 选项卡中,在表中选择一个文件系统名称。

  2. 查看显示历史容量趋势的 SSD 使用情况图。

  3. 选择不同的时间范围以查看不同时期的容量行为。

  4. 将鼠标悬停在图表上的决策点上,可查看特定时刻的建议或自动化操作的详细信息。

  5. 使用图表中的见解:

    • 了解需要调整容量的频率

    • 评估自动化或推荐模式是否更适合您的工作负载模式

    • 识别重复性容量限制

    • 根据增长趋势规划未来的容量需求

    • 对失败的自动化尝试进行故障排除

使用集群表

clusters 表提供了每个 FSx for ONTAP 文件系统的详细视图以及性能和使用指标。

步骤
  1. 概述 选项卡中,查看集群表。

  2. 使用搜索框按名称查找特定文件系统。

  3. 选择列标题以对数据进行排序。

  4. 使用 SSD 使用情况 来识别接近容量限制的文件系统。

  5. 使用 吞吐量使用率 (P99) 将吞吐量需求与配置的吞吐量 SKU 进行比较。

    将鼠标悬停在吞吐量列标题上以获取计算详细信息。

  6. 要自定义列,请选择列设置图标并选择要显示的列。

  7. 要导出数据,请选择导出图标以下载 CSV 文件。

  8. 要执行批量操作,请使用复选框选择多个文件系统,然后选择 编辑参数

最佳实践

使用概览控制面板时,请考虑以下建议:

  • 定期监控:定期检查仪表板,以便在趋势成为问题之前识别它们。

  • 设置适当的阈值:根据您的工作负载模式和容量规划偏好配置 SSD 管理阈值。

  • 有效使用过滤器:将区域和帐户过滤器组合起来,专注于基础设施的特定子集。

  • 及时查看建议:按上次 SSD 增加时间戳或描述过滤集群表,以识别具有容量建议的文件系统。审查这些建议并采取行动,以防止容量限制。

  • 选择正确的模式:当您想要控制容量决策时,请使用 Recommend 模式,或者使用 Automation 模式进行免提管理。

  • 监控决策点:定期查看容量图上的决策点,以了解算法行为,并验证设置是否符合您的需求。

  • 利用批量编辑:管理多个文件系统时,使用批量参数编辑来维护一致的容量管理策略。