回應磁碟故障所造成的動態效能事件
您可以使用Unified Manager來調查工作負載過度使用Aggregate所造成的效能事件。您也可以使用Unified Manager來檢查Aggregate的健全狀況、查看在Aggregate上偵測到的最近健全狀況事件是否有助於效能事件。
您需要的是什麼
-
您必須具有「操作員」、「應用程式管理員」或「儲存管理員」角色。
-
必須有新的、已確認的或過時的效能事件。
-
顯示「事件詳細資料」頁面以檢視事件的相關資訊。
-
請閱讀* Description*、其中說明事件所涉及的工作負載、以及爭用的叢集元件。
有多個受害者磁碟區發生爭用時、其延遲會受到叢集元件的影響。位於RAID重建中心的Aggregate會以備用磁碟取代故障磁碟、這是爭用的叢集元件。在「元件爭用中」下、Aggregate圖示會反白顯示為紅色、而Aggregate的名稱會顯示在括弧中。
-
在「工作負載使用率」圖表中、選取*「Bull Workload*」。
-
將游標停留在圖表上、即可檢視影響元件的高效能工作負載。
圖表頂端會顯示自偵測到事件以來最高尖峰使用率的最高工作負載。其中最重要的工作負載之一是系統定義的工作負載「磁碟健全狀況」、這表示RAID已重建。重建是指使用備用磁碟重建Aggregate所需的內部程序。磁碟健全狀況工作負載連同其他工作負載在集合體上、可能會導致對集合體和相關事件的爭用。
-
確認磁碟健全狀況工作負載的活動造成事件後、請等待約30分鐘、讓重建作業完成、並讓Unified Manager分析事件、偵測集合體是否仍處於爭用狀態。
-
重新整理*事件詳細資料*。
RAID重建完成後、請檢查狀態是否已過時、表示事件已解決。
-
在「工作負載使用率」圖表中、選取*「Bull Workload*」、即可依尖峰使用率檢視集合體上的工作負載。
-
在「建議動作」區域中、按一下「分析工作負載」按鈕、即可查看最重要的工作負載。
-
在「工作負載分析」頁面中、設定時間範圍、以顯示所選磁碟區的最後24小時(1天)資料。
在「事件時間表」中、有一個紅點()表示何時發生磁碟故障事件。
-
在「節點與Aggregate使用率」圖表中、隱藏「節點」統計資料行、以便只保留集合線。
-
將此圖表中的資料與*延遲*圖表中事件發生時的資料進行比較。
在事件發生時、Aggregate使用率會顯示大量的讀寫活動、這是RAID重建程序所造成的、這會增加所選磁碟區的延遲。事件發生數小時後、讀取和寫入以及延遲都會減少、確認集合體已不再處於爭用狀態。