在 EDA 工作負載中使用概覽儀表板
作為管理跨多個 FSx for ONTAP 檔案系統(ONTAP 叢集)的 EDA 工作負載的 IT 管理員,您可以使用 Overview 儀表板快速評估叢集的運作狀況和使用情況。您可以利用它來決定新磁碟區或作業的放置位置,識別需要遷移的磁碟區或 SVM,以及確定何時擴充容量或處理量。
概況
概覽儀表板提供 FSx for ONTAP 叢集的集中視圖,包括容量和吞吐量。您可以使用它來放置新磁碟區、重新平衡工作負載以及規劃容量或吞吐量擴充。
儀錶板包含:
-
叢集健全狀況狀態:儀表板頂端摘要的資訊,重點顯示檔案系統中的延遲事件、SSD 使用率和容量建議以及 ONTAP EMS 事件。
-
叢集表:一個詳細的、可搜尋的表格,顯示每個叢集的使用情況和效能指標,支援篩選、排序、分頁和 CSV 匯出。
要求
使用儀表板之前,請確保您符合下列需求:
- 具有檢視權限的 AWS 憑證
-
您必須在 Workload Factory 中設定 AWS 認證資料、並至少具備 General Storage 的讀取(檢視)權限。不支援 Basic 認證資料。
如果您尚未設定具有檢視權限的認證資料,則開啟「概覽」標籤時,您將被重新導向至 AWS 認證資料設定頁面。
如果您尚未配置 AWS 憑證,請參閱 "新增 AWS 憑證"。
- 啟動儀表板
-
Workload Factory 確認具有檢視權限的憑證後,您必須啟動儀表板才能開始收集 FSx for ONTAP 檔案系統的 CloudWatch 指標。
|
|
您同意後,指標收集可能需要一些時間。控制面板會在初始收集過程中通知您。 |
-
使用以下任一方式登入 "主機體驗"。
-
選擇選單
,然後選擇 EDA。 -
選擇 Overview 標籤。
-
如果未偵測到具有檢視權限的憑證,請選擇 Add credentials,然後依照提示配置具有檢視權限的 AWS 憑證。之後返回 Overview 選項卡。
-
請查看同意提示,其中描述了將為您的 FSx for ONTAP 檔案系統收集的 CloudWatch 指標。
-
選擇 Activate 以啟動儀表板並開始收集指標。
Workload Factory 開始收集與您設定的 AWS 認證相關聯的所有 FSx for ONTAP 檔案系統的 CloudWatch 指標。當指標可用時,儀表板會填入資料。如果收集仍在進行中,則會顯示通知。
篩選儀表板
使用儀表板頂端的篩選器來專注於特定的檔案系統。這些篩選器適用於延遲、使用率和 ONTAP 事件區段以及叢集表格。
可用篩選條件:
-
Region:依一個或多個 AWS 區域篩選。
-
AWS 帳戶:依照與您設定的認證相關聯的一或多個 AWS 帳戶進行篩選。
更新篩選條件後,所有資訊都會重新整理,只顯示符合的檔案系統。
叢集健全狀況
儀表板頂部會顯示已篩選檔案系統的運作狀況和活動概覽。此資訊僅在您的檔案系統至少關聯一個 FSx for ONTAP 連結時才會顯示。如果沒有可用連結,則此資訊將被隱藏。
-
延遲:顯示範圍內檔案系統中偵測到的延遲事件數量。
-
使用率:顯示 SSD 使用率狀態,並識別具有主動容量建議的檔案系統。
-
ONTAP 事件:顯示偵測到的 EMS 事件數量,按容量、可用性與保護以及安全性與其他進行分類。
延遲
顯示範圍內檔案系統中偵測到的延遲事件數量。
-
當您選取 Review 時,會顯示 Latency 標籤。
-
只有啟用延遲監控後才能查看延遲資訊。如果您尚未設定延遲臨界值,請選取 Configure。如需延遲監控的詳細資訊,請參閱 "FSx 延遲分析"。
使用率
顯示範圍內至少有一個叢集的 SSD 使用率超過 80% 的檔案系統數量,以及具有主動容量建議的檔案系統數量。這有助於您快速識別可能需要注意容量的檔案系統。
容量建議
Workload Factory 會自動對 EDA 清單中可見的每個 FSx for ONTAP 檔案系統執行容量建議演算法。該演算法每 24 小時掃描一次,並識別何時建議調整 SSD 容量。
當識別出建議時:
-
根據您的 Workload Factory 通知設定,您會立即收到通知(電子郵件或 WAD)。通知會在識別出建議後立即傳送,而非等待每週摘要。
-
對於任何具有有效建議的檔案系統,Clusters 表格列中會顯示燈泡指示器。
-
此處顯示具有有效建議的檔案系統總數。這樣即使受影響的檔案系統不在表格的第一頁,也能確保建議可見。
檢視並套用容量建議
-
使用以下任一方式登入 "主機體驗"。
-
選擇選單
,然後選擇 EDA。 -
選擇 Overview 標籤。
-
在 Clusters 表格中,找到帶有燈泡指示器的檔案系統。
將滑鼠游標暫留在燈泡指示器上,即可查看包含建議簡要說明的工具提示。
-
在表格中選取叢集名稱以開啟並檢視建議。
-
檢閱 SSD 建議和容量圖表。
該建議解釋了建議的變更及其背後的原因。例如:我們建議您根據檔案系統的 SSD 使用模式增加 SSD 容量。
此圖表顯示目前的 SSD 使用量以及歷史趨勢,並向您展示容量建議演算法如何隨時間調整容量。
-
在圖表右上角、選取時間範圍以變更顯示的期間。預設為一週。
ONTAP 事件
顯示範圍內檔案系統中偵測到的 EMS 事件數量,按容量、可用性與保護以及安全性與其他進行分類。
顯示與容量問題相關的 EMS 訊息數量,以及受影響的檔案系統數量。
監控的 EMS 事件範例包括:
-
Aggregate 接近全滿/全滿
-
Volume 幾乎已滿 / 已滿
-
Snapshot 保留空間幾乎已滿 / 已滿
-
目錄大小已滿
-
FlexGroup 已滿
-
Inode 已滿
如需受監控 EMS 事件的完整清單,請參閱 "容量事件"。
選擇 Capacity 將導覽至 Storage workloads 中的容量分析畫面。
顯示與可用性和資料保護相關的 EMS 訊息數量,以及受影響的檔案系統數量。
監控的事件包括 FlexCache 及 SnapMirror 相關的 EMS 事件。
選擇 Availability & protection 將導航至 Storage workloads 中的可用性和保護分析畫面。
顯示未歸類於「容量」或「可用性與保護」的事件的 EMS 訊息數量,以及受影響的檔案系統數量。監控的事件包括反勒索軟體保護、NFS 驗證失敗等。
選擇 Security & other 將導覽至 Storage workloads 中的事件分析畫面。
叢集表
提供與您配置的 AWS 憑證關聯的每個 FSx for ONTAP 檔案系統的詳細視圖,並按活動區域和 AWS 帳戶選擇進行篩選。資料是從 CloudWatch 指標收集而來。此表格支援搜尋、欄篩選、分頁、欄自訂和 CSV 匯出。
關鍵指標包括:
-
名稱、區域和 AWS 帳戶
-
SSD 容量指標(已使用、總計和使用百分比)
-
容量資源池儲存設備
-
處理量指標(過去 30 天的平均值、P95、P99 和最大值)
使用 SSD 使用情況 來識別接近容量上限的檔案系統。使用 吞吐量使用情況 (P99) 來比較吞吐量需求與已配置的吞吐量 SKU。將滑鼠游標暫留在吞吐量欄標題上可查看計算詳細資料。
搜尋和篩選
-
使用搜尋功能,依名稱、檔案系統 ID、區域或其他屬性尋找特定叢集。
-
選擇任何欄標題,即可依該欄排序表格。
-
使用每欄篩選控制項來縮小表格中的結果範圍。
-
表格已分頁。使用表格底部的分頁控制項可在頁面之間導覽。
|
|
具有主動容量建議的檔案系統會在表格中顯示燈泡指示器。選擇任何檔案系統名稱,即可檢視該檔案系統的 SSD 容量指標、歷史使用趨勢和容量建議。 |
自訂欄
若要在叢集表格中新增或移除欄位:
-
選擇右側表格上方的欄選擇器圖示。
-
選取或取消選取要顯示或隱藏的欄。
-
選擇*應用*。
將表格匯出為 CSV
您可以將目前顯示的表格資料匯出到 CSV 檔案,以便進行進一步分析或報告。
-
套用您希望在匯出中反映的任何篩選條件或欄自訂設定。
-
選擇叢集表上方的
按鈕。
下載的 CSV 檔案包含表格中目前可見的所有列,但僅包含目前顯示的欄。