クラスタ コンポーネントとその競合要因

クラスタ コンポーネントの競合の原因となるクラスタのパフォーマンスの問題を特定することができます。コンポーネントを使用するワークロードのパフォーマンスが低下し、クライアント要求に対する応答時間(レイテンシ)が長くなると、Unified Managerでイベントがトリガーされます。

競合状態のコンポーネントは、最適なレベルのパフォーマンスを提供できません。そのコンポーネント自体のパフォーマンスが低下するほか、他のクラスタ コンポーネントやワークロード(Victimと呼ばれます)のレイテンシが増大することもあります。コンポーネントの競合状態を解消するには、ワークロードを減らすか処理能力を高めることでパフォーマンスを通常のレベルまで戻す必要があります。Unified Managerでは、ワークロードのパフォーマンスの収集と分析が5分間隔で行われるため、クラスタ コンポーネントの利用率が高い状態が長時間続いたときにのみ検出されます。利用率が高い状態が5分間のうちの短時間しか続かないような一時的な利用率の急増は検出されません。

ストレージ アグリゲートが競合状態になる原因としては、たとえば、1つ以上のワークロードがそれぞれのI/O要求に対応するために競合する場合などがあります。アグリゲートの他のワークロードに影響し、それらのワークロードのパフォーマンスが低下する可能性があります。アグリゲートのアクティビティを減らす方法はいくつかありますが、たとえば、1つ以上のワークロードを負荷の低いアグリゲートまたはノードに移動し、現在のアグリゲートに対する全体的なワークロードの負荷を低くするなどの方法が効果的です。QoSポリシー グループの場合は、スループット制限を調整したりワークロードを別のポリシー グループに移動したりすることで、ワークロードが抑制されないようにすることができます。

Unified Managerでは、次のクラスタ コンポーネントを監視し、これらのコンポーネントが競合状態になるとアラートを生成します。

ネットワーク
クラスタ上の外部ネットワーク プロトコルによる I/O 要求の待機時間を表します。待機時間は、「転送準備」完了トランザクションが完了するまで待機してからクラスタが I/O 要求に応答できるまでの時間です。ネットワーク コンポーネントが競合状態にある場合、ブロック プロトコル レイヤでの長い待機時間は、1つ以上のワークロードのレイテンシに影響していることを意味します。
ネットワーク処理
プロトコル レイヤとクラスタ間のI/O処理に関与する、クラスタ内のソフトウェア コンポーネントを表します。ネットワーク処理を実行するノードが、イベント検出後に変更された可能性があります。ネットワーク処理コンポーネントが競合状態にある場合、ネットワーク処理ノードでの高利用率は、1つ以上のワークロードのレイテンシに影響していることを意味します。
オールSANアレイ クラスタをアクティブ / アクティブ構成で使用している場合、ネットワーク処理のレイテンシの値が両方のノードについて表示され、ノードで負荷を適切に共有していることを確認できます。
最大QoS
ワークロードに割り当てられたストレージQoSポリシー グループの最大スループット(ピーク)を表します。ポリシー グループ コンポーネントが競合状態にある場合、ポリシー グループ内のすべてのワークロードに、スループットの制限によってスロットルが適用され、1つ以上のワークロードのレイテンシに影響していることを意味します。
最小QoS
他のワークロードに割り当てられたQoSスループットの下限(想定)設定によって引き起こされている、ワークロードへのレイテンシを表します。設定されているQoSの下限に応じて特定のワークロードが保証されたスループットを確保するために帯域幅の大部分を使用すると、他のワークロードは調整されてレイテンシが増大します。
クラスタ インターコネクト
クラスタ ノードを物理的に接続するケーブルとアダプタを表します。クラスタ インターコネクト コンポーネントが競合状態にある場合は、クラスタ インターコネクトでのI/O要求の長い待機時間がワークロードのレイテンシに影響していることを意味します。
データ処理
クラスタとストレージ アグリゲート間でワークロードを含むI/O処理に関与する、クラスタ内のソフトウェア コンポーネントを表します。データ処理を扱うノードが、イベント検出後に変更された可能性があります。データ処理コンポーネントが競合状態にある場合、データ処理ノードでの高利用率は、1つ以上のワークロードのレイテンシに影響していることを意味します。
ボリュームのアクティブ化
すべてのアクティブ ボリュームの使用状況を追跡するプロセスです。1000を超えるアクティブ ボリュームを擁する大規模な環境で、ノード経由で同時にリソースにアクセスする必要がある重要なボリュームの数を追跡します。同時アクティブ ボリュームの数が推奨される最大しきい値を超えると、重要でない一部のボリュームでレイテンシが発生します。
MetroClusterのリソース
NVRAMとインタースイッチ リンク(ISL)を含むMetroClusterリソースを表します。MetroCluster構成のクラスタ間でデータをミラーリングするのに使用します。MetroClusterコンポーネントが競合状態にある場合は、ローカル クラスタのワークロードによる大量の書き込みスループットまたはリンクの不具合が、ローカル クラスタの1つ以上のワークロードのレイテンシに影響していることを意味します。クラスタがMetroCluster構成に含まれていない場合は、このアイコンは表示されません。
アグリゲートまたはSSDアグリゲートの処理
ワークロードが実行されているストレージ アグリゲートを表します。アグリゲート コンポーネントが競合状態にある場合は、アグリゲートの高利用率が1つ以上のワークロードのレイテンシに影響していることを意味します。アグリゲートには、HDDのみで構成されるものと、HDDとSSDが混在するもの(Flash Poolアグリゲート)があります。「SSDアグリゲート」には、SSDのみで構成されるもの(オールフラッシュ アグリゲート)と、SSDとクラウド階層が混在するもの(FabricPoolアグリゲート)があります。
クラウド レイテンシ
クラスタとユーザ データ格納先のクラウド階層の間のI/O処理に関与する、クラスタ内のソフトウェア コンポーネントを表します。クラウド レイテンシ コンポーネントが競合状態にある場合、クラウド階層でホストされたボリュームからの大量の読み取りが1つ以上のワークロードのレイテンシに影響していることを意味します。
同期SnapMirror
SnapMirror同期関係でのプライマリ ボリュームからセカンダリ ボリュームへのユーザ データのレプリケーションに関係する、クラスタ内のソフトウェア コンポーネントを表します。同期SnapMirrorコンポーネントが競合状態にある場合、SnapMirror同期処理のアクティビティが1つ以上のワークロードのレイテンシに影響していることを意味します。