ユーザ定義のパフォーマンスしきい値ポリシーの仕組み

ストレージ オブジェクト(アグリゲートとボリュームなど)に対してパフォーマンスしきい値ポリシーを設定して、クラスタでパフォーマンスの問題が発生していることを通知するイベントをストレージ管理者に送信できるようにします。

ストレージ オブジェクトのパフォーマンスしきい値ポリシーを作成する手順は次のとおりです。

たとえば、ボリュームのIOPSが10分間連続して1秒あたり750件の処理数を超えるたびに重大イベントの通知を受け取るように、ボリュームに対してパフォーマンスしきい値ポリシーを設定できます。同じしきい値ポリシーで、IOPSが10分間継続して1秒あたり500件の処理数を超えたときに警告イベントを送信するように指定することもできます。

注:現在のリリースでは、カウンタの値が設定値を超えたときにイベントを送信するしきい値を設定できます。カウンタの値が設定値を下回ったときにイベントを送信するしきい値は設定できません。

次のカウンタ チャートでは、13:00に警告のしきい値(黄色のアイコン)に違反し、12:10、12:30、13:10に重大のしきい値(赤色のアイコン)に違反していることがわかります。



しきい値の違反は、指定された期間、継続的に発生する必要があります。何らかの理由でしきい値を下回った場合は、その次の違反が新しい期間の開始とみなされます。

一部のクラスタ オブジェクトとパフォーマンス カウンタでは、2つのパフォーマンス カウンタが上限を超えた場合にイベントが生成されるしきい値ポリシーを作成できます。たとえば、次の条件を使用してしきい値ポリシーを作成できます。

クラスタ オブジェクト パフォーマンス カウンタ 警告のしきい値 重大のしきい値 期間
ボリューム レイテンシ 10ミリ秒 20ミリ秒 15分
アグリゲート 利用率 65% 85%

2つのクラスタ オブジェクトを使用するしきい値ポリシーでは、両方の条件に違反した場合にのみイベントが生成されます。上の表に定義されたしきい値ポリシーを使用した場合、次のようになります

ボリューム レイテンシの平均 アグリゲートのディスク利用率 結果
15ミリ秒 50% イベントは報告されません。
15ミリ秒 75% 警告イベントが報告されます。
25ミリ秒 75% 警告イベントが報告されます。
25ミリ秒 90% 重大イベントが報告されます。