Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

了解 Workload Factory for EDA 中的 Overview 儀表板

貢獻者 netapp-sineadd

概覽儀表板為管理跨多個 FSx for ONTAP 檔案系統執行的 EDA 工作負載的 IT 管理員提供了一個集中視圖。您可以使用它快速評估叢集運作狀況和使用情況,確定新磁碟區或作業的放置位置,識別需要遷移的磁碟區或 SVM,以及確定何時擴充容量或吞吐量。

概況

概覽儀表板會收集與您設定的 AWS 認證相關聯之所有 FSx for ONTAP 檔案系統的 CloudWatch 指標。

其中包括:

  • 叢集健全狀況狀態:頂端的摘要資訊會強調顯示檔案系統中的延遲事件、SSD 使用率和容量建議,以及 ONTAP EMS 事件。

  • 叢集表:一個詳細的、可搜尋的表格,顯示每個叢集的使用情況和效能指標,支援篩選、排序、分頁和 CSV 匯出。

它可協助您:

  • 放置新磁碟區並重新平衡工作負載

  • 規劃容量或處理量擴充

  • 大規模監控叢集健全狀況

  • 就磁碟區放置做出明智的決策

  • 識別接近容量限制的叢集

儀表板元件

叢集健全狀況

叢集健全狀況狀態提供已篩選檔案系統的活動快照。只有當至少有一個 FSx for ONTAP 連結與您的檔案系統關聯時,才會顯示此資訊。

健康狀態包括下列領域:

延遲

顯示範圍內檔案系統中偵測到的延遲事件數量。只有啟用延遲監控後才能查看延遲資訊。

SSD 容量管理

顯示 SSD 使用率超過 80% 的檔案系統數量以及具有主動容量建議的檔案系統數量。這有助於您快速識別可能需要容量關注的檔案系統。

ONTAP 事件

顯示偵測到的 EMS 事件數量,按容量、可用性與保護以及安全性與其他類別進行分類。

叢集表

叢集表提供了每個 FSx for ONTAP 檔案系統的詳細視圖,並依您目前所在的區域和 AWS 帳戶進行篩選。資料來源於 CloudWatch 指標。

使用此表可以:

  • 識別接近容量上限的檔案系統(SSD 使用量欄)

  • 將吞吐量需求與已佈建的吞吐量 SKU 進行比較(吞吐量使用量 P99 欄)

  • 追蹤多個叢集的效能指標

  • 檢查連結組態狀態(相關連結欄)- 每日驗證連線有效性

  • 選擇多個叢集進行批次參數更新

SSD 容量管理

Overview 儀表板提供智慧化 SSD 容量管理。

管理模式

自動化

Workload Factory 會根據預先定義的閾值和使用模式自動增加 SSD 容量。系統無需人工介入即可管理容量擴充。這對於偏好自動化管理的環境而言是理想之選。

建議

Workload Factory 會分析您的 SSD 使用模式,並提供容量提升建議。您可以手動審核並應用這些建議。這樣,您既可以完全掌控容量決策,又能受益於自動化分析。

系統不會提供容量建議或執行任何自動操作。當您想要在無需系統協助的情況下手動管理容量時,此功能非常有用。

容量建議

當 Workload Factory 處於「自動」或「建議」模式時,系統會自動為每個 FSx for ONTAP 檔案系統執行容量建議演算法。該演算法每 24 小時掃描一次,並識別何時建議調整 SSD 容量。

當識別出建議時:

  • 您將根據 Workload Factory 通知設定立即收到通知

  • 可以透過按「上次 SSD 增加時間戳記」或「上次 SSD 增加描述」欄位篩選「叢集」表來識別具有建議的檔案系統

  • 顯示具有有效建議的檔案系統總數

該建議解釋了建議的變更及其背後的原因,例如:我們建議您根據檔案系統的 SSD 使用模式增加 SSD 容量。

SSD 管理參數

參數控制容量管理系統如何分析和處理您的 SSD 使用情況:

臨界值 (10-90%)

觸發容量建議或自動化動作的 SSD 使用率百分比。例如,閾值為 80% 表示當 SSD 使用率達到 80% 時會發生建議或動作。在「建議」和「自動化」模式下均可使用。

Lookback(1-200 小時)

用於分析歷史 SSD 使用模式的時間段。更長的回溯期可為容量決策提供更多歷史背景資訊。僅在 Automate 模式下可用。

提前 (1-200 小時)

用於預測未來容量需求的時段。預測時段越長,對未來容量成長的規劃就越長遠。僅在自動模式下可用。

您可以為每個檔案系統單獨配置這些參數,也可以使用批次編輯在多個檔案系統中套用一致的設定。

了解容量決策點

SSD 使用圖會顯示決策點,這些決策點指示何時產生容量建議或執行自動化操作。這些視覺化指標有助於您了解容量管理演算法隨時間推移的行為。

建議決策點

當容量建議演算法識別出需要額外的 SSD 容量時出現。如果 SSD 容量未增加,這些點可能每 30 分鐘出現一次。圖表會盡可能顯示所有決策點,或者如果時間範圍使個別點過於密集時將其合併。

自動化決策點

當自動化系統嘗試增加 SSD 容量時出現。這些點指示自動化動作是成功還是失敗。

使用歷史 SSD 使用圖表的決策點來:

  • 了解需要進行容量調整的頻率

  • 評估自動化或建議模式是否更適合您的工作負載模式

  • 識別反覆出現的容量限制

  • 根據成長趨勢規劃未來的容量需求

  • 疑難排解失敗的自動化嘗試