回應磁碟故障所造成的動態效能事件
您可以使用Unified Manager來調查工作負載過度使用Aggregate所造成的效能事件。您也可以使用Unified Manager來檢查Aggregate的健全狀況、查看在Aggregate上偵測到的最近健全狀況事件是否有助於效能事件。
開始之前
-
您必須OnCommand 具備「操作員」、「資訊管理員」或「儲存管理員」角色。
-
必須有新的、已確認的或過時的效能事件。
步驟
-
顯示「事件詳細資料」頁面以檢視事件的相關資訊。
-
請閱讀* Description*、其中說明事件所涉及的工作負載、以及爭用的叢集元件。
有多個受害者磁碟區發生爭用時、其延遲會受到叢集元件的影響。位於RAID重建中心的Aggregate會以備用磁碟取代故障磁碟、這是爭用的叢集元件。在「元件爭用中」下、Aggregate圖示會反白顯示為紅色、而Aggregate的名稱會顯示在括弧中。
-
在「工作負載使用率」圖表中、選取*「Bull Workload*」。
-
將游標停留在圖表上、即可檢視影響元件的高效能工作負載。
圖表頂端會顯示自偵測到事件以來最高尖峰使用率的最高工作負載。其中最重要的工作負載之一是系統定義的工作負載「磁碟健全狀況」、這表示RAID已重建。重建是指使用備用磁碟重建Aggregate所需的內部程序。磁碟健全狀況工作負載連同其他工作負載在集合體上、可能會導致對集合體和相關事件的爭用。
-
確認磁碟健全狀況工作負載的活動造成事件後、請等待約30分鐘、讓重建作業完成、並讓Unified Manager分析事件、偵測集合體是否仍處於爭用狀態。
-
在Unified Manager中、搜尋您在步驟2中記錄的事件ID。
磁碟故障事件會顯示在「事件詳細資料」頁面上。RAID重建完成後、請檢查狀態是否已過時、表示事件已解決。
-
在「工作負載使用率」圖表中、選取*「Bull Workload*」、即可依尖峰使用率檢視集合體上的工作負載。
-
瀏覽至「效能/磁碟區詳細資料」頁面以瞭解最重要的工作負載。
-
按一下「* 1D*」以顯示所選Volume的最後24小時(1天)資料。
在「延遲」圖表中、有一個紅點()表示何時發生磁碟故障事件。
-
選擇*解密資料依據*。
-
在「元件」下、選取「磁碟使用率」。
-
按一下*提交*。
「磁碟使用率」圖表會顯示所選工作負載對目標Aggregate磁碟的所有讀取和寫入要求圖表。
-
比較*磁碟使用率*圖表中的資料與*延遲*圖表中事件發生時的資料。
事件發生時、磁碟使用率會顯示RAID重建程序所造成的大量讀寫活動、進而增加所選磁碟區的延遲。事件發生數小時後、讀取和寫入以及延遲都會減少、確認集合體已不再處於爭用狀態。