效能事件分析與通知
效能事件會通知您叢集元件發生爭用所造成的工作負載I/O效能問題。Unified Manager會分析事件、找出所有相關工作負載、爭用元件、以及事件是否仍是您可能需要解決的問題。
Unified Manager會監控叢集上磁碟區的I/O延遲(回應時間)和IOPS(作業)。例如、當其他工作負載過度使用叢集元件時、元件會發生爭用、無法在最佳層級執行以滿足工作負載需求。使用相同元件的其他工作負載效能可能會受到影響、導致延遲增加。如果延遲超過動態效能臨界值、Unified Manager會觸發效能事件通知您。
事件分析
Unified Manager會使用前15天的效能統計資料、執行下列分析、以識別事件中所涉及的受害者工作負載、高效能工作負載及叢集元件:
-
識別延遲超過動態效能臨界值(延遲預測的上限)的受害者工作負載:
-
對於HDD或Flash Pool混合式Aggregate(本機層)上的磁碟區、只有在延遲大於5毫秒(毫秒)且IOPS每秒操作超過10次(作業/秒)時、才會觸發事件。
-
對於All SSD集合體或FabricPool 架構(雲端層)上的磁碟區、只有在延遲大於1毫秒且IOPS超過100次作業/秒時、才會觸發事件
-
-
識別爭用中的叢集元件。
如果叢集互連的受害工作負載延遲大於1毫秒、Unified Manager會將此視為重大問題、並觸發叢集互連的事件。
-
識別過度使用叢集元件並導致其爭用的高層工作負載。
-
根據工作負載在叢集元件使用率或活動方面的差異、對所涉及的工作負載進行排名、以判斷哪些基礎架構在叢集元件的使用率上有最高的變更、以及哪些受害者受影響最大。
事件可能只發生一小段時間、然後在使用的元件不再發生爭用時自行修正。持續事件是指在五分鐘間隔內、針對同一個叢集元件再次發生、並保持作用中狀態的事件。對於持續事件、Unified Manager會在連續兩個分析時間間隔內偵測到相同事件後觸發警示。
事件解決後、仍可在Unified Manager中使用、以記錄某個磁碟區過去的效能問題。每個事件都有一個唯一的ID、可識別事件類型、以及涉及的磁碟區、叢集和叢集元件。
單一磁碟區可同時參與多個事件。 |
事件狀態
事件可能處於下列其中一種狀態:
-
主動
表示效能事件目前為作用中(新增或已確認)。導致事件的問題本身並未修正、或尚未解決。儲存物件的效能計數器仍高於效能臨界值。
-
過時
表示事件不再處於作用中狀態。導致事件的問題已自行修正或已解決。儲存物件的效能計數器不再超過效能臨界值。
事件通知
這些事件會顯示在儀表板頁面和使用者介面的許多其他頁面上、而這些事件的警示則會傳送至指定的電子郵件地址。您可以在「事件詳細資料」頁面和「工作負載分析」頁面上、檢視事件的詳細分析資訊、並取得解決問題的建議。
事件互動
在「事件詳細資料」頁面和「工作負載分析」頁面上、您可以使用下列方式與事件互動:
-
將滑鼠移到事件上會顯示訊息、顯示偵測到事件的日期和時間。
如果同一時間段有多個事件、訊息會顯示事件數目。
-
按一下單一事件會顯示一個對話方塊、顯示更多有關事件的詳細資訊、包括相關的叢集元件。
爭用中的元件會圈選並反白顯示為紅色。您可以按一下*檢視完整分析*、在「事件詳細資料」頁面上檢視完整分析。如果同一時間段有多個事件、對話方塊會顯示最近三個事件的詳細資料。您可以按一下事件、在「事件詳細資料」頁面上檢視事件分析。