QoS ポリシーグループの調整が原因の動的なパフォーマンスイベントへの対処
Unified Manager を使用して、ワークロードのスループット( MBps )を調整しているサービス品質( QoS )ポリシーグループが原因のパフォーマンスイベントを調査できます。この調整によって、ポリシーグループ内のボリュームワークロードの応答時間(レイテンシ)が増加します。イベント情報を使用して、ポリシーグループに新しい制限値を設定して調整を停止する必要があるかどうかを判断できます。
作業を開始する前に
-
オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。
-
新規、確認済み、または廃止状態のパフォーマンスイベントが存在する必要があります。
手順
-
イベントの詳細情報を表示するには、イベントの詳細 * ページを表示します。
-
概要 * を確認します。スロットルの影響を受けるワークロードの名前が表示されます。
調整の結果、あるワークロードは自身の Victim になるため、概要には Victim と Bully に同じワークロードが表示されることがあります。
-
テキストエディタなどのアプリケーションを使用して、ボリュームの名前を記録します。
あとでボリューム名で検索できます。
-
ワークロードレイテンシ / ワークロード利用率のグラフで、「 * Bully workloads * 」を選択します。
-
グラフにカーソルを合わせると、ポリシーグループに影響を与えている上位のユーザ定義ワークロードが表示されます。
偏差が最も大きく、調整の原因となったワークロードがリストの最上位に表示されます。アクティビティは、ポリシーグループ制限に対して各ワークロードが使用している割合です。
-
Suggested Actions * 領域で、上位のワークロードの * Analyze Workload * ボタンをクリックします。
-
ワークロード分析*ページで、レイテンシグラフにすべてのクラスタコンポーネントを表示し、スループットグラフに内訳を表示するように設定します。
内訳グラフは、レイテンシグラフと IOPS グラフの下に表示されます。
-
「 * Latency * 」グラフの QoS 制限を比較して、調整した量がイベント発生時にレイテンシに影響した状況を確認します。
QoS ポリシーグループの最大スループットが 1 秒あたり 1 、 000op/sec の場合、ポリシーグループ内のワークロードの合計がこの値を超えることはできません。イベント発生時、ポリシーグループ内のワークロードの合計スループットが 1 、 200op/sec を超えたため、ポリシーグループのアクティビティが 1 、 000op/sec に調整されました
-
読み取り / 書き込みレイテンシ * の値と、読み取り / 書き込み / その他 * の値を比較します。
どちらのグラフでも、レイテンシが高い読み取り要求が多数ある一方で、書き込み要求の数は少なくレイテンシも低くなっています。これらの値から、レイテンシを増加させた大量のスループットまたは処理の有無を判断できます。これらの値は、スループットまたは処理数にポリシーグループの制限を設定するかどうかを決定する際に使用できます。
-
ONTAP システムマネージャを使用して、ポリシーグループの現在の制限値を 1 、 300op/sec に増やします
-
1 日後、手順 3 でメモしたワークロードを「ワークロードの分析 * 」ページに入力します。
-
スループット内訳グラフを選択します。
読み取り / 書き込み / その他のグラフが表示されます。
-
ページの上部で、変更イベントのアイコン()をクリックします。
-
読み取り / 書き込み / その他 * のグラフを * Latency * のグラフと比較します。
読み取り要求と書き込み要求は同じですが、調整は停止し、レイテンシは低下しています。