Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

在 EDA 工作负载中使用概览仪表板

贡献者 netapp-sineadd

作为管理数十个 FSx for ONTAP 文件系统的 EDA 工作负载的 IT 管理员,您可以使用概述仪表板回答有关群集状态的常见日常操作问题。使用它来确定在哪里放置新的卷或作业,了解大规模的群集使用情况,并就扩展容量和提高或降低吞吐量做出明智的决策。

概述

概览控制面板提供集中式集群视图,可帮助您快速了解跨容量、吞吐量和 IOPS 的集群使用情况,并确定放置新卷或移动现有卷和 SVM 的位置。

控制面板包括:

  • 集群运行状况状态:在信息板顶部汇总的信息,突出显示整个集群的延迟、可用性和保护以及安全事件和容量建议。

  • 集群表:详细的可搜索表,显示每个 FSx for ONTAP 集群的使用情况和性能指标,支持过滤、排序、分页和 CSV 导出。

要求

使用概览控制面板之前,请确保满足以下要求:

具有查看权限的 AWS 凭据

您必须在 Workload Factory 中配置 AWS 凭据,至少具有常规存储的读取(查看)权限。不支持使用 Basic 模式配置的凭据。

如果您没有配置具有查看权限的凭据,则在打开"概述"选项卡时将重定向到 AWS 凭据设置页面。

如果您尚未配置 AWS 凭据,请参见 "添加 AWS 凭据"

激活 EDA 仪表板

确认具有查看权限的凭据后,您必须激活 Workload Factory 的仪表板,以开始为您的 FSx for ONTAP 文件系统收集 CloudWatch 指标。

备注 在您提供同意后,收集指标可能需要一些时间。正在进行初始收集时,仪表板会通知您。
步骤
  1. 使用以下任一方式登录 "主机体验"

  2. 选择菜单 汉堡菜单图标,然后选择 EDA

  3. 选择 Overview 选项卡。

  4. 如果未检测到具有查看权限的凭据,请选择 Add credentials 并按照提示使用查看权限配置 AWS 凭据。然后返回 Overview 选项卡。

  5. 查看同意提示,说明将为您的 FSx for ONTAP 文件系统收集的 CloudWatch 指标。

  6. 选择 Activate 以激活仪表板并开始收集指标。

结果

Workload Factory 开始收集与您配置的 AWS 凭据相关联的所有 FSx for ONTAP 文件系统的 CloudWatch 指标。当指标可用时,概览控制面板会填充。如果收集仍在进行中,则会显示通知。

筛选仪表板

使用概览仪表板顶端的筛选器,将重点放在与当前任务相关的文件系统上。这些是 Workload Factory 级别的筛选器,适用于延迟和 ONTAP 事件信息以及集群表。

可用筛选器:

  • 区域:按一个或多个 AWS 区域进行筛选。

  • AWS 账户:按与您配置的凭据关联的一个或多个 AWS 账户进行筛选。

更新筛选器选择时,将刷新所有信息,仅显示匹配的文件系统和群集。

集群运行状况状态

在概览仪表板的顶端,将显示筛选的群集中的事件活动和运行状况的摘要视图。仅当至少一个 FSx for ONTAP 链接与您的文件系统相关联时,才会显示此信息。如果没有可用的链接,信息将被隐藏。

延迟

延迟部分显示在范围内跨文件系统检测到的延迟事件数。

  • 计数反映了 "FSx 延迟分析" 功能生成的延迟事件。

  • 选择 Review 将导航到 Latency 选项卡。

  • 仅当启用了延迟监控时,才能查看延迟信息。如果您尚未配置延迟阈值,请选择 Configure。有关延迟监控的详细信息,请参阅 "FSx 延迟分析"

容量

容量部分显示与容量问题相关的 EMS 消息数量,以及受影响的文件系统数量。

监测的 EMS 事件包括但不限于:

  • 聚合几乎已满

  • 聚合已满

  • 卷接近满

  • 卷已满

  • Snapshot 预留接近满

  • Snapshot 预留已满

  • 目录大小已满

  • Flex 组已满

  • 索引节点已满

有关监测的 EMS 事件的完整列表,请参见 "容量事件"

选择 Capacity 将导航到 Storage workloads 中的容量分析屏幕。

可用性和保护

可用性和保护部分显示与可用性和数据保护相关的 EMS 消息数量,以及受影响的文件系统数量。

监测到的事件包括 FlexCache 和 SnapMirror 相关的 EMS 事件。

选择 Availability & protection 将导航到 Storage workloads 中的可用性和保护分析屏幕。

安全及其他

"安全和其他"部分显示未归类为"容量"或"可用性和保护"的事件的 EMS 消息数量,以及受影响的文件系统数量。监控的事件包括反勒索软件保护、NFS 身份验证失败等。

选择 Security & other 将导航到 Storage workloads 中的事件分析屏幕。

Clusters 表

集群表提供了与您配置的 AWS 凭据相关联的每个 FSx for ONTAP 集群的详细视图,按活动区域和 AWS 账户选择进行筛选。数据是从 CloudWatch 指标中收集的。该表支持搜索、列筛选、分页、列自定义和 CSV 导出。

搜索和筛选

  • 使用搜索按名称、文件系统 ID、区域或其他属性查找特定群集。

  • 选择任何列标题以按该列对表进行排序。

  • 使用每列筛选器控件来缩小表中的结果。

  • 表格已分页。使用表格底部的分页控件在页面之间导航。

该表包括以下列。默认情况下显示的列显示在表中。您可以使用列选择器添加或删除非默认列。对于吞吐量列,将鼠标悬停在列标题上,以了解有关 30 天计算周期和使用公式的详细信息。

默认 说明

集群名称

FSx for ONTAP 集群的名称。

地区

部署集群的 AWS 区域。

AWS 帐户

与集群关联的 AWS 帐户。

SSD 已用容量

当前正在使用的 SSD 存储量。

总 SSD 容量

配置的 SSD 存储容量总计。

SSD 使用量

使用中的 SSD 容量百分比。使用此功能可以确定接近容量限制的集群,以免它们影响工作负载性能。

容量池

容量池中的存储量。

平均吞吐量

过去 30 天的平均吞吐量。

P95 吞吐量

过去 30 天的第 95 百分位吞吐量。

P99 吞吐量

过去 30 天的第 99 个百分点吞吐量。

最大吞吐量

过去 30 天记录的最大吞吐量。

吞吐量使用情况 (P99)

相对于配置的吞吐量 SKU 的 P99 吞吐量。使用此选项可识别吞吐量始终接近或处于配置限制的群集。

吞吐量 SKU

已配置的吞吐量层。将其与吞吐量使用情况进行比较,以评估当前 SKU 的大小是否适当。

自定义列

从集群表中添加或删除列:

  1. 选择右侧表格上方的列选择器图标。

  2. 选择或取消选择要显示或隐藏的列。

  3. 选择*应用*。

将表导出为 CSV

您可以将当前显示的表数据导出为 CSV 文件,以进行进一步分析或报告。

  1. 应用要反映在导出中的任何筛选器或列自定义项。

  2. 选择集群表上方的 下载 按钮。

CSV 文件已下载,其中包含表中当前可见的所有行,仅包括当前显示的列。