在 EDA 工作負載中使用概覽儀表板
身為管理數十個 FSx for ONTAP 檔案系統上的 EDA 工作負載的 IT 管理員,您可以使用概覽儀表板來解答有關叢集狀態的常見日常運維問題。您可以利用它來確定新磁碟區或作業的放置位置,了解叢集的大規模使用情況,並就容量和吞吐量的擴展或縮減做出明智的決策。
概況
概覽儀表板提供集中式叢集檢視,可協助您快速瞭解叢集在容量、處理量和 IOPS 方面的使用情況,並確定新磁碟區的放置位置或現有磁碟區和 SVM 的移動位置。
儀錶板包含:
-
叢集健全狀況狀態:儀表板頂端摘要的資訊,重點顯示叢集的延遲、可用性和保護、安全性事件和容量建議。
-
叢集表:一個詳細的、可搜尋的表格,顯示每個 FSx for ONTAP 叢集的使用情況和效能指標,支援篩選、排序、分頁和 CSV 匯出。
要求
使用概覽儀表板之前、請確保您符合下列要求:
- 具有檢視權限的 AWS 憑證
-
您必須在 Workload Factory 中設定 AWS 認證,且至少擁有對 General Storage 的讀取(檢視)權限。不支援以 Basic 模式設定的認證。
如果您尚未配置具有檢視權限的憑證,則開啟「概覽」標籤時,您將被重新導向至 AWS 憑證設定頁面。
如果您尚未配置 AWS 憑證,請參閱 "新增 AWS 憑證"。
- 啟動 EDA 儀表板
-
確認具有檢視權限的憑證後,您必須啟動 Workload Factory 的儀表板,才能開始收集 FSx for ONTAP 檔案系統的 CloudWatch 指標。
|
|
您同意後,指標收集可能需要一些時間。控制面板會在初始收集過程中通知您。 |
-
使用以下任一方式登入 "主機體驗"。
-
選擇選單
,然後選擇 EDA。 -
選擇 Overview 標籤。
-
如果未偵測到具有檢視權限的憑證,請選擇 Add credentials,然後依照提示配置具有檢視權限的 AWS 憑證。之後返回 Overview 選項卡。
-
請查看同意提示,其中描述了將為您的 FSx for ONTAP 檔案系統收集的 CloudWatch 指標。
-
選擇 Activate 以啟動儀表板並開始收集指標。
Workload Factory 開始收集與您設定的 AWS 憑證關聯的所有 FSx for ONTAP 檔案系統的 CloudWatch 指標。概覽儀表板會在指標可用時更新。如果收集仍在進行中,則會顯示通知。
篩選儀表板
使用概覽儀表板頂部的篩選器,將注意力集中在與目前任務相關的檔案系統上。這些是 Workload Factory 層級的篩選器,適用於延遲和 ONTAP 事件資訊以及叢集表。
可用篩選條件:
-
Region:依一個或多個 AWS 區域篩選。
-
AWS 帳戶:依照與您設定的認證相關聯的一或多個 AWS 帳戶進行篩選。
更新篩選條件後,所有資訊都會重新整理,只顯示相符的檔案系統和叢集。
叢集健全狀況
在概覽儀表板頂部,會顯示已篩選叢集的事件活動和運作狀況的總計檢視。只有當至少有一個 FSx for ONTAP 連結與您的檔案系統相關聯時,才會顯示此資訊。如果沒有可用的連結,則會隱藏此資訊。
延遲
延遲部分顯示在範圍內的檔案系統中偵測到的延遲事件數量。
-
該計數反映了 "FSx 延遲分析" 功能產生的延遲事件。
-
選擇 Review 將跳到 Latency 標籤。
-
只有啟用延遲監控後才能查看延遲資訊。如果您尚未設定延遲臨界值,請選取 Configure。如需延遲監控的詳細資訊,請參閱 "FSx 延遲分析"。
容量
容量部分顯示與容量問題相關的 EMS 訊息數量,以及受影響的檔案系統數量。
監控的 EMS 事件包括但不限於:
-
Aggregate 幾乎已滿
-
Aggregate 已滿
-
磁碟區幾乎已滿
-
Volume 已滿
-
Snapshot 保留空間幾乎已滿
-
快照預留已滿
-
目錄大小已滿
-
Flex 群組已滿
-
Inode 已滿
如需受監控 EMS 事件的完整清單,請參閱 "容量事件"。
選擇 Capacity 將導覽至 Storage workloads 中的容量分析畫面。
可用性與保護
「可用性和保護」部分顯示與可用性和資料保護相關的 EMS 訊息數量,以及受影響的檔案系統數量。
監控的事件包括 FlexCache 及 SnapMirror 相關的 EMS 事件。
選擇 Availability & protection 將導航至 Storage workloads 中的可用性和保護分析畫面。
安全性與其他
「安全及其他」部分顯示未歸類於「容量」或「可用性與保護」下的事件的 EMS 訊息數量,以及受影響的檔案系統數量。監控的事件包括反勒索軟體保護、NFS 身份驗證失敗等。
選擇 Security & other 將導覽至 Storage workloads 中的事件分析畫面。
叢集表
叢集表格提供與您設定的 AWS 認證相關聯的每個 FSx for ONTAP 叢集的詳細檢視,並依作用中區域和 AWS 帳戶選擇進行篩選。資料是從 CloudWatch 指標收集而來。此表格支援搜尋、欄篩選、分頁、欄自訂和 CSV 匯出。
搜尋和篩選
-
使用搜尋功能,依名稱、檔案系統 ID、區域或其他屬性尋找特定叢集。
-
選擇任何欄標題,即可依該欄排序表格。
-
使用每欄篩選控制項來縮小表格中的結果範圍。
-
表格已分頁。使用表格底部的分頁控制項可在頁面之間導覽。
表格包含以下欄位。表格中已標示預設顯示的欄位。您可以使用欄位選擇器新增或刪除非預設欄位。對於吞吐量欄位,將滑鼠停留在欄位標題上可查看有關 30 天計算週期和使用量公式的詳細資訊。
| 欄 | 預設 | 說明 |
|---|---|---|
叢集名稱 |
是的 |
FSx for ONTAP 叢集的名稱。 |
地區 |
是的 |
叢集部署所在的 AWS 區域。 |
AWS 帳戶 |
否 |
與叢集相關聯的 AWS 帳戶。 |
SSD 已使用容量 |
是的 |
目前正在使用的 SSD 儲存空間。 |
SSD 總容量 |
是的 |
已配置的 SSD 儲存總容量。 |
SSD 使用情況 |
是的 |
使用中的 SSD 容量百分比。使用此指標可在叢集接近容量限制之前識別叢集,避免影響工作負載效能。 |
容量池 |
是的 |
容量池中的儲存量。 |
平均吞吐量 |
是的 |
過去 30 天的平均處理量。 |
P95 吞吐量 |
否 |
過去 30 天的第 95 個百分位吞吐量。 |
P99 吞吐量 |
是的 |
過去 30 天內吞吐量的第 99 個百分位數。 |
最大吞吐量 |
否 |
過去 30 天內記錄到的最大處理量。 |
吞吐量使用情形 (P99) |
是的 |
P99 吞吐量相對於已佈建吞吐量 SKU 的比值。使用此功能可識別吞吐量持續接近或達到已佈建上限的叢集。 |
處理量 SKU |
是的 |
已配置的吞吐量層級。將其與吞吐量使用情況進行比較,以評估目前 SKU 的容量是否合適。 |
自訂欄
若要在叢集表格中新增或移除欄位:
-
選擇右側表格上方的欄選擇器圖示。
-
選取或取消選取要顯示或隱藏的欄。
-
選擇*應用*。
將表格匯出為 CSV
您可以將目前顯示的表格資料匯出到 CSV 檔案,以便進行進一步分析或報告。
-
套用您希望在匯出中反映的任何篩選條件或欄自訂設定。
-
選擇叢集表上方的
按鈕。
下載的 CSV 檔案包含表格中目前可見的所有列,但僅包含目前顯示的欄。