回應QoS原則群組節流所造成的動態效能事件
您可以使用Unified Manager來調查服務品質(QoS)原則群組節流工作負載處理量(Mbps)所造成的效能事件。節流可增加原則群組中Volume工作負載的回應時間(延遲)。您可以使用事件資訊來判斷是否需要對原則群組進行新的限制、才能停止節流。
開始之前
-
您必須OnCommand 具備「操作員」、「資訊管理員」或「儲存管理員」角色。
-
必須有新的、已確認的或過時的效能事件。
步驟
-
顯示「事件詳細資料」頁面以檢視事件的相關資訊。
-
請閱讀* Description*、其中會顯示受節流影響的工作負載名稱。
此說明可為受害者顯示相同的工作負載、而且不受影響、因為節流會使工作負載成為本身的受害者。
-
使用文字編輯器等應用程式來記錄磁碟區名稱。
您可以在磁碟區名稱上搜尋、以便稍後找到。
-
在工作負載延遲和工作負載活動圖表中、選取* Bully Workload*。
-
將游標停留在圖表上、即可檢視影響原則群組的使用者定義工作負載排行。
清單頂端的工作負載有最高的偏差、導致節流發生。活動是每個工作負載所使用的原則群組限制百分比。
-
瀏覽至「效能/磁碟區詳細資料」頁面以瞭解最重要的工作負載。
-
選擇*解密資料依據*。
-
選取「* Latency(延遲)」旁邊的核取方塊、以選取所有延遲明細圖。
-
在「* IOPS 」下、選取「*讀取/寫入/其他」。
-
按一下*提交*。
明細圖表會顯示在「延遲」圖表和IOPS圖表下方。
-
比較*原則群組影響*圖表與*延遲*圖表、瞭解節流在事件發生時會影響延遲的百分比。
原則群組的最大處理量為每秒1、000次作業(每秒)、其中的工作負載不能一起超過。在事件發生時、原則群組中的工作負載的總處理量超過1、200個作業/秒、導致原則群組將其活動減至1、000個作業/秒原則群組影響圖表顯示節流導致總延遲的10%、確認節流導致事件發生。
-
請檢閱*叢集元件*圖表、其中顯示各叢集元件的總延遲。
原則群組的延遲最高、進一步確認節流導致事件。
-
將*讀取/寫入延遲*圖表與*讀取/寫入/其他*圖表進行比較。
這兩個圖表都顯示高延遲的大量讀取要求、但寫入要求的要求數量和延遲時間都很低。這些值可協助您判斷是否有大量處理量或作業數量增加延遲。您可以在決定將原則群組限制放在處理量或作業上時使用這些值。
-
使用「系統管理程式」將原則群組的目前限制提高至1、300次作業/秒OnCommand
-
一天後、返回Unified Manager並搜尋您在步驟3中記錄的工作負載名稱。
隨即顯示「效能/ Volume詳細資料」頁面。
-
選擇*將資料細分*>* IOPS *。
-
按一下*提交*。
隨即顯示讀取/寫入/其他圖表。
-
在頁面底部、將游標指向變更事件圖示()。
-
將*讀取/寫入/其他*圖表與*延遲*圖表進行比較。
讀取和寫入要求相同、但節流已停止、延遲已減少。