了解 Workload Factory for EDA 中的 Overview 儀表板
概覽儀表板為管理跨多個 FSx for ONTAP 檔案系統執行的 EDA 工作負載的 IT 管理員提供了一個集中視圖。您可以使用它快速評估叢集運作狀況和使用情況,確定新磁碟區或作業的放置位置,識別需要遷移的磁碟區或 SVM,以及確定何時擴充容量或吞吐量。
概況
概覽儀表板會收集與您設定的 AWS 認證相關聯之所有 FSx for ONTAP 檔案系統的 CloudWatch 指標。
其中包括:
-
叢集健全狀況狀態:頂端的摘要資訊會強調顯示檔案系統中的延遲事件、SSD 使用率和容量建議,以及 ONTAP EMS 事件。
-
叢集表:一個詳細的、可搜尋的表格,顯示每個叢集的使用情況和效能指標,支援篩選、排序、分頁和 CSV 匯出。
它可協助您:
-
放置新磁碟區並重新平衡工作負載
-
規劃容量或處理量擴充
-
大規模監控叢集健全狀況
-
就磁碟區放置做出明智的決策
-
識別接近容量限制的叢集
儀表板元件
叢集健全狀況
叢集健全狀況狀態提供已篩選檔案系統的活動快照。只有當至少有一個 FSx for ONTAP 連結與您的檔案系統關聯時,才會顯示此資訊。
健康狀態包括下列領域:
- 延遲
-
顯示範圍內檔案系統中偵測到的延遲事件數量。只有啟用延遲監控後才能查看延遲資訊。
- SSD 容量管理
-
顯示 SSD 使用率超過 80% 的檔案系統數量以及具有主動容量建議的檔案系統數量。這有助於您快速識別可能需要容量關注的檔案系統。
- ONTAP 事件
-
顯示偵測到的 EMS 事件數量,按容量、可用性與保護以及安全性與其他類別進行分類。
叢集表
叢集表提供了每個 FSx for ONTAP 檔案系統的詳細視圖,並依您目前所在的區域和 AWS 帳戶進行篩選。資料來源於 CloudWatch 指標。
使用此表可以:
-
識別接近容量上限的檔案系統(SSD 使用量欄)
-
將吞吐量需求與已佈建的吞吐量 SKU 進行比較(吞吐量使用量 P99 欄)
-
追蹤多個叢集的效能指標
-
檢查連結組態狀態(相關連結欄)- 每日驗證連線有效性
-
選擇多個叢集進行批次參數更新
SSD 容量管理
Overview 儀表板提供智慧化 SSD 容量管理。
管理模式
- 自動化
-
Workload Factory 會根據預先定義的閾值和使用模式自動增加 SSD 容量。系統無需人工介入即可管理容量擴充。這對於偏好自動化管理的環境而言是理想之選。
- 建議
-
Workload Factory 會分析您的 SSD 使用模式,並提供容量提升建議。您可以手動審核並應用這些建議。這樣,您既可以完全掌控容量決策,又能受益於自動化分析。
- 無
-
系統不會提供容量建議或執行任何自動操作。當您想要在無需系統協助的情況下手動管理容量時,此功能非常有用。
容量建議
當 Workload Factory 處於「自動」或「建議」模式時,系統會自動為每個 FSx for ONTAP 檔案系統執行容量建議演算法。該演算法每 24 小時掃描一次,並識別何時建議調整 SSD 容量。
當識別出建議時:
-
您將根據 Workload Factory 通知設定立即收到通知
-
可以透過按「上次 SSD 增加時間戳記」或「上次 SSD 增加描述」欄位篩選「叢集」表來識別具有建議的檔案系統
-
顯示具有有效建議的檔案系統總數
該建議解釋了建議的變更及其背後的原因,例如:我們建議您根據檔案系統的 SSD 使用模式增加 SSD 容量。
SSD 管理參數
參數控制容量管理系統如何分析和處理您的 SSD 使用情況:
- 臨界值 (10-90%)
-
觸發容量建議或自動化動作的 SSD 使用率百分比。例如,閾值為 80% 表示當 SSD 使用率達到 80% 時會發生建議或動作。在「建議」和「自動化」模式下均可使用。
- Lookback(1-200 小時)
-
用於分析歷史 SSD 使用模式的時間段。更長的回溯期可為容量決策提供更多歷史背景資訊。僅在 Automate 模式下可用。
- 提前 (1-200 小時)
-
用於預測未來容量需求的時段。預測時段越長,對未來容量成長的規劃就越長遠。僅在自動模式下可用。
您可以為每個檔案系統單獨配置這些參數,也可以使用批次編輯在多個檔案系統中套用一致的設定。
了解容量決策點
SSD 使用圖會顯示決策點,這些決策點指示何時產生容量建議或執行自動化操作。這些視覺化指標有助於您了解容量管理演算法隨時間推移的行為。
- 建議決策點
-
當容量建議演算法識別出需要額外的 SSD 容量時出現。如果 SSD 容量未增加,這些點可能每 30 分鐘出現一次。圖表會盡可能顯示所有決策點,或者如果時間範圍使個別點過於密集時將其合併。
- 自動化決策點
-
當自動化系統嘗試增加 SSD 容量時出現。這些點指示自動化動作是成功還是失敗。
使用歷史 SSD 使用圖表的決策點來:
-
了解需要進行容量調整的頻率
-
評估自動化或建議模式是否更適合您的工作負載模式
-
識別反覆出現的容量限制
-
根據成長趨勢規劃未來的容量需求
-
疑難排解失敗的自動化嘗試