Unified Managerがワークロードのレイテンシを使用してパフォーマンスの問題を特定する仕組み

ワークロードのレイテンシ(応答時間)は、クラスタ上のボリュームがクライアント アプリケーションからのI/O要求に応答するまでの時間です。Unified Managerは、レイテンシを使用してパフォーマンス イベントを検出し、アラートを生成します。

高レイテンシは、アプリケーションからクラスタ上のボリュームへの要求に通常よりも時間がかかっていることを意味します。高レイテンシの原因はクラスタ自体、具体的にはいくつかのクラスタ コンポーネントでの競合にある可能性があります。また、クラスタ外の問題(ネットワークのボトルネックなど)、アプリケーションをホストしているクライアントの問題、またはアプリケーション自体の問題が原因の場合もあります。

注:Unified Managerは、クラスタ内のワークロードだけを監視します。アプリケーションやクライアント、アプリケーションとクラスタ間のパスは監視しません。

クラスタに対する処理(バックアップの作成や重複排除の実行など)も他のワークロードと共有しているクラスタ コンポーネントへの負荷を増大させるため、高レイテンシの原因になります。実際のレイテンシが想定範囲のパフォーマンスしきい値を超えると、Unified Managerはイベントを分析して、解決が必要なパフォーマンス イベントであるかどうかを判断します。レイテンシは処理あたりのミリ秒(ms/op)単位で測定されます。

[パフォーマンス / ボリュームの詳細]ページでは、レイテンシ統計の分析を表示して、個々のプロセス(読み取り / 書き込み要求など)のアクティビティを全体的なレイテンシに照らして比較できます。この比較により、最もアクティビティが高い処理を特定したり、ボリュームのレイテンシに影響を及ぼしている異常なアクティビティがある特定の処理がないかを判断できます。パフォーマンス イベントを分析するにあたっては、レイテンシの統計値を使用してイベントの原因がクラスタ上の問題にあるかどうかを判断できます。また、イベントに関係しているワークロードのアクティビティまたはクラスタ コンポーネントを特定することもできます。


Performance Managerでの正常な応答時間

この例は、[パフォーマンス / ボリュームの詳細]ページの[レイテンシ]チャートを示しています。実際の応答時間(レイテンシ)アクティビティは青い線、想定範囲はグレーで表されています。

注:Unified Managerでデータを収集できなかった期間は、青い線が途切れています。これは、クラスタまたはボリュームと通信できなかったか、Unified Managerがその時間にオフになっていたか、データの収集に5分以上かかった場合に起こります。