Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

在 EDA 工作負載中使用概覽儀表板

貢獻者 netapp-sineadd

身為管理數十個 FSx for ONTAP 檔案系統上的 EDA 工作負載的 IT 管理員,您可以使用概覽儀表板來解答有關叢集狀態的常見日常運維問題。您可以利用它來確定新磁碟區或作業的放置位置,了解叢集的大規模使用情況,並就容量和吞吐量的擴展或縮減做出明智的決策。

概況

概覽儀表板提供集中式叢集檢視,可協助您快速瞭解叢集在容量、處理量和 IOPS 方面的使用情況,並確定新磁碟區的放置位置或現有磁碟區和 SVM 的移動位置。

儀錶板包含:

  • 叢集健全狀況狀態:儀表板頂端摘要的資訊,重點顯示叢集的延遲、可用性和保護、安全性事件和容量建議。

  • 叢集表:一個詳細的、可搜尋的表格,顯示每個 FSx for ONTAP 叢集的使用情況和效能指標,支援篩選、排序、分頁和 CSV 匯出。

要求

使用概覽儀表板之前、請確保您符合下列要求:

具有檢視權限的 AWS 憑證

您必須在 Workload Factory 中設定 AWS 認證,且至少擁有對 General Storage 的讀取(檢視)權限。不支援以 Basic 模式設定的認證。

如果您尚未配置具有檢視權限的憑證,則開啟「概覽」標籤時,您將被重新導向至 AWS 憑證設定頁面。

如果您尚未配置 AWS 憑證,請參閱 "新增 AWS 憑證"

啟動 EDA 儀表板

確認具有檢視權限的憑證後,您必須啟動 Workload Factory 的儀表板,才能開始收集 FSx for ONTAP 檔案系統的 CloudWatch 指標。

註 您同意後,指標收集可能需要一些時間。控制面板會在初始收集過程中通知您。
步驟
  1. 使用以下任一方式登入 "主機體驗"

  2. 選擇選單 漢堡選單圖示,然後選擇 EDA

  3. 選擇 Overview 標籤。

  4. 如果未偵測到具有檢視權限的憑證,請選擇 Add credentials,然後依照提示配置具有檢視權限的 AWS 憑證。之後返回 Overview 選項卡。

  5. 請查看同意提示,其中描述了將為您的 FSx for ONTAP 檔案系統收集的 CloudWatch 指標。

  6. 選擇 Activate 以啟動儀表板並開始收集指標。

結果

Workload Factory 開始收集與您設定的 AWS 憑證關聯的所有 FSx for ONTAP 檔案系統的 CloudWatch 指標。概覽儀表板會在指標可用時更新。如果收集仍在進行中,則會顯示通知。

篩選儀表板

使用概覽儀表板頂部的篩選器,將注意力集中在與目前任務相關的檔案系統上。這些是 Workload Factory 層級的篩選器,適用於延遲和 ONTAP 事件資訊以及叢集表。

可用篩選條件:

  • Region:依一個或多個 AWS 區域篩選。

  • AWS 帳戶:依照與您設定的認證相關聯的一或多個 AWS 帳戶進行篩選。

更新篩選條件後,所有資訊都會重新整理,只顯示相符的檔案系統和叢集。

叢集健全狀況

在概覽儀表板頂部,會顯示已篩選叢集的事件活動和運作狀況的總計檢視。只有當至少有一個 FSx for ONTAP 連結與您的檔案系統相關聯時,才會顯示此資訊。如果沒有可用的連結,則會隱藏此資訊。

延遲

延遲部分顯示在範圍內的檔案系統中偵測到的延遲事件數量。

  • 該計數反映了 "FSx 延遲分析" 功能產生的延遲事件。

  • 選擇 Review 將跳到 Latency 標籤。

  • 只有啟用延遲監控後才能查看延遲資訊。如果您尚未設定延遲臨界值,請選取 Configure。如需延遲監控的詳細資訊,請參閱 "FSx 延遲分析"

容量

容量部分顯示與容量問題相關的 EMS 訊息數量,以及受影響的檔案系統數量。

監控的 EMS 事件包括但不限於:

  • Aggregate 幾乎已滿

  • Aggregate 已滿

  • 磁碟區幾乎已滿

  • Volume 已滿

  • Snapshot 保留空間幾乎已滿

  • 快照預留已滿

  • 目錄大小已滿

  • Flex 群組已滿

  • Inode 已滿

如需受監控 EMS 事件的完整清單,請參閱 "容量事件"

選擇 Capacity 將導覽至 Storage workloads 中的容量分析畫面。

可用性與保護

「可用性和保護」部分顯示與可用性和資料保護相關的 EMS 訊息數量,以及受影響的檔案系統數量。

監控的事件包括 FlexCache 及 SnapMirror 相關的 EMS 事件。

選擇 Availability & protection 將導航至 Storage workloads 中的可用性和保護分析畫面。

安全性與其他

「安全及其他」部分顯示未歸類於「容量」或「可用性與保護」下的事件的 EMS 訊息數量,以及受影響的檔案系統數量。監控的事件包括反勒索軟體保護、NFS 身份驗證失敗等。

選擇 Security & other 將導覽至 Storage workloads 中的事件分析畫面。

叢集表

叢集表格提供與您設定的 AWS 認證相關聯的每個 FSx for ONTAP 叢集的詳細檢視,並依作用中區域和 AWS 帳戶選擇進行篩選。資料是從 CloudWatch 指標收集而來。此表格支援搜尋、欄篩選、分頁、欄自訂和 CSV 匯出。

搜尋和篩選

  • 使用搜尋功能,依名稱、檔案系統 ID、區域或其他屬性尋找特定叢集。

  • 選擇任何欄標題,即可依該欄排序表格。

  • 使用每欄篩選控制項來縮小表格中的結果範圍。

  • 表格已分頁。使用表格底部的分頁控制項可在頁面之間導覽。

表格包含以下欄位。表格中已標示預設顯示的欄位。您可以使用欄位選擇器新增或刪除非預設欄位。對於吞吐量欄位,將滑鼠停留在欄位標題上可查看有關 30 天計算週期和使用量公式的詳細資訊。

預設 說明

叢集名稱

是的

FSx for ONTAP 叢集的名稱。

地區

是的

叢集部署所在的 AWS 區域。

AWS 帳戶

與叢集相關聯的 AWS 帳戶。

SSD 已使用容量

是的

目前正在使用的 SSD 儲存空間。

SSD 總容量

是的

已配置的 SSD 儲存總容量。

SSD 使用情況

是的

使用中的 SSD 容量百分比。使用此指標可在叢集接近容量限制之前識別叢集,避免影響工作負載效能。

容量池

是的

容量池中的儲存量。

平均吞吐量

是的

過去 30 天的平均處理量。

P95 吞吐量

過去 30 天的第 95 個百分位吞吐量。

P99 吞吐量

是的

過去 30 天內吞吐量的第 99 個百分位數。

最大吞吐量

過去 30 天內記錄到的最大處理量。

吞吐量使用情形 (P99)

是的

P99 吞吐量相對於已佈建吞吐量 SKU 的比值。使用此功能可識別吞吐量持續接近或達到已佈建上限的叢集。

處理量 SKU

是的

已配置的吞吐量層級。將其與吞吐量使用情況進行比較,以評估目前 SKU 的容量是否合適。

自訂欄

若要在叢集表格中新增或移除欄位:

  1. 選擇右側表格上方的欄選擇器圖示。

  2. 選取或取消選取要顯示或隱藏的欄。

  3. 選擇*應用*。

將表格匯出為 CSV

您可以將目前顯示的表格資料匯出到 CSV 檔案,以便進行進一步分析或報告。

  1. 套用您希望在匯出中反映的任何篩選條件或欄自訂設定。

  2. 選擇叢集表上方的 下載 按鈕。

下載的 CSV 檔案包含表格中目前可見的所有列,但僅包含目前顯示的欄。