パフォーマンスイベントの分析と通知
パフォーマンスイベントは、クラスタコンポーネントの競合に起因するボリュームワークロードのI/Oパフォーマンスの問題を管理者に通知します。Unified Manager はイベントを分析して、関連するすべてのワークロード、競合状態のコンポーネント、および解決する必要のある問題かどうかを特定します。
Unified Manager は、クラスタ上のボリュームの I/O レイテンシ(応答時間)と IOPS (処理数)を監視します。たとえば、他のワークロードがクラスタコンポーネントを過剰に使用している場合、そのコンポーネントは競合状態にあり、ワークロードの要件を満たす最適なパフォーマンスレベルを提供できません。同じコンポーネントを使用している他のワークロードのパフォーマンスに影響し、レイテンシが増加する可能性があります。レイテンシがパフォーマンスしきい値を超えると、Unified Managerはパフォーマンスイベントをトリガーして、Eメールアラートをユーザに送信します。
イベント分析
Unified Manager は、過去 15 日間のパフォーマンス統計を使用して次の分析を実行し、 Victim ワークロード、 Bully ワークロード、およびイベントに関連するクラスタコンポーネントを特定します。
-
レイテンシが想定範囲の上限であるパフォーマンスしきい値を超えたVictimワークロードを特定します。
-
HDDまたはFlash Pool(ハイブリッド)アグリゲートのボリュームの場合、レイテンシが5ミリ秒を超え、かつIOPSが1秒あたり10件(ops/sec)を超えた場合にのみイベントがトリガーされます。
-
オールSSDアグリゲートまたはFabricPool (複合)アグリゲートのボリュームの場合、レイテンシが1ミリ秒を超え、かつIOPSが100ops/秒を超えた場合にのみイベントがトリガーされます
-
-
競合状態のクラスタコンポーネントを特定します。
クラスタインターコネクトで Victim ワークロードのレイテンシが 1 ミリ秒を超えた場合、 Unified Manager はこれを重大な状況とみなしてクラスタインターコネクトのイベントをトリガーします。
-
クラスタコンポーネントを過剰に消費して競合状態を引き起こしている Bully ワークロードを特定します。
-
クラスタコンポーネントの利用率またはアクティビティの偏差に基づいて関連するワークロードをランク付けし、クラスタコンポーネントの使用量の変化が最も大きい Bully ワークロードと最も影響を受けた Victim ワークロードを特定します。
ごく短時間しか発生せず、コンポーネントの競合状態が解消した時点で自己修復されるイベントもあります。継続的なイベントとは、 5 分以内に同じクラスタコンポーネントについて再発し、アクティブな状態のままのイベントのことです。Unified Manager は、連続する 2 つの分析期間に同じイベントを検出するとアラートをトリガーします。未解決のままで残るイベントは新規の状態であり、ワークロードがイベント変更に関与すると異なる概要 メッセージが表示される可能性があります。
解決されたイベントは、ボリュームの過去のパフォーマンス問題の記録として Unified Manager で引き続き参照できます。各イベントには、イベントタイプとボリューム、クラスタ、および関連するクラスタコンポーネントを識別する一意の ID が割り当てられます。
1 つのボリュームが複数のイベントに同時に関連している場合があります。 |
イベントの状態
イベントは次のいずれかの状態になります。
-
* アクティブ *
現在アクティブなパフォーマンスイベント(新規または確認済みのイベント)を示します。自己修復または解決されていないイベントを引き起こしている問題。ストレージオブジェクトのパフォーマンスカウンタがパフォーマンスしきい値を超えたままになっているものです。
-
* 廃止 *
アクティブではなくなったイベントを示します。自己修復または解決されたイベントである問題。ストレージオブジェクトのパフォーマンスカウンタがパフォーマンスしきい値を上回らなくなったものです。
イベント通知
イベントアラートは、[ダッシュボード/概要]ページ、[ダッシュボード/パフォーマンス]ページ、[パフォーマンス/ボリュームの詳細]ページに表示され、指定した電子メールアドレスに送信されます。イベントの詳細な分析情報を表示して、推奨される解決方法をイベントの詳細ページで確認できます。
この例では、イベントが赤い点()をクリックします。このドットにマウスカーソルを合わせると、イベントの詳細と分析するためのオプションがポップアップに表示されます。
イベントの対話
[パフォーマンス/ボリュームの詳細]ページでは、次の方法でイベントを操作できます。
-
赤いドットにカーソルを合わせると、イベントID、レイテンシ、1秒あたりの処理数、およびイベントが検出された日時が表示されます。
同じ期間にイベントが複数ある場合は、イベントの数と、ボリュームの平均レイテンシおよび1秒あたりの処理数が表示されます。
-
1つのイベントをクリックすると、そのイベントに関する詳細情報を示すダイアログボックスが表示されます。ダイアログボックスには、関連するクラスタコンポーネントも含まれます。これは、イベントの詳細ページの概要セクションに似ています。
競合状態のコンポーネントは赤い丸で囲んで表示されます。イベントIDまたは*すべての解析を表示*をクリックすると、イベントの詳細ページに完全な解析を表示できます。同じ期間にイベントが複数ある場合は、最新の 3 つのイベントの詳細がダイアログボックスに表示されます。イベントIDをクリックすると、イベントの詳細ページでイベント分析を確認できます。同じ期間にイベントが3つ以上ある場合、赤い点をクリックしてもダイアログボックスは表示されません。