QoSポリシー グループの調整が原因の動的なパフォーマンス イベントへの対処

Unified Managerを使用して、ワークロードのスループット(MBps)を調整しているサービス品質(QoS)ポリシー グループが原因のパフォーマンス イベントを調査できます。この調整によって、ポリシー グループ内のボリューム ワークロードの応答時間(レイテンシ)が増大することがあります。イベント情報を使用して、ポリシー グループに新しい制限値を設定して調整を停止する必要があるかどうかを判断できます。

開始する前に

手順

  1. [イベントの詳細]ページを表示してイベントに関する情報を確認します。
  2. 説明で、調整の影響を受けたワークロードの名前を確認します。
    注:調整の結果、あるワークロードは自身のVictimになるため、VictimとBullyに同じワークロードが表示されることがあります。
  3. テキスト エディタなどのアプリケーションを使用して、ボリュームの名前を記録します。
    あとでボリューム名で検索できます。
  4. [ワークロード レイテンシ]および[ワークロード利用率]のグラフで、[Bully ワークロード]を選択します。
  5. グラフにカーソルを合わせると、ポリシー グループに影響を与えている上位のユーザ定義ワークロードが表示されます。
    偏差が最も大きく、調整の原因となったワークロードがリストの最上位に表示されます。アクティビティは、ポリシー グループ制限に対して各ワークロードが使用している割合です。
  6. [推奨される操作]領域で、先頭にあるワークロードの[ワークロードを分析]ボタンをクリックします。
  7. [ワークロード分析]ページで、レイテンシ グラフにすべてのクラスタ コンポーネントを表示し、スループット グラフに内訳を表示するように設定します。
    内訳グラフは[レイテンシ]グラフと[IOPS]グラフの下に表示されます。
  8. [レイテンシ]グラフのQoS制限を比較して、調整されたスループットがイベント発生時にどの程度影響していたかを確認します。
    QoSポリシー グループの最大スループットが1秒あたり1,000op/secの場合、ポリシー グループ内のワークロードの合計がこの値を超えることはできません。イベントの発生時、ポリシー グループ内のワークロードの合計スループットが1,200op/secを超えたため、ポリシー グループのアクティビティが1,000op/secに調整されました。
  9. [読み取り / 書き込みレイテンシ]の値と[読み取り / 書き込み / その他]の値を比較します。
    どちらのグラフでも、レイテンシが高い読み取り要求が多数ある一方で、書き込み要求の数は少なくレイテンシも低くなっています。これらの値からは、レイテンシを増加させた大量のスループットまたは処理の有無を判断できます。これらの値は、スループットまたは処理数にポリシー グループの制限を設定するかどうかを決定する際に使用できます。
  10. ONTAP System Managerを使用して、ポリシー グループの現在の制限値を1,300op/secに増やします。
  11. 1日後、手順3で記録したワークロードの名前をUnified Manager[ワークロード分析]ページで入力します。
  12. スループット内訳グラフを選択します。
    [読み取り / 書き込み / その他]グラフが表示されます。
  13. ページの上部で、ポリシー グループ制限の変更イベント アイコン(変更イベント アイコン)にカーソルを合わせます。
  14. [読み取り / 書き込み / その他]グラフと[レイテンシ]グラフを比較します。
    読み取り要求と書き込み要求の数は変わっていませんが、調整は停止し、レイテンシも低下しています。