ディスク障害によって発生する動的なパフォーマンスイベントに対応する
Unified Managerを使用して、アグリゲートを過剰に消費しているワークロードが原因のパフォーマンス イベントを調査できます。また、Unified Managerを使用してアグリゲートの健全性を確認し、アグリゲートで検出された最近の健全性イベントがパフォーマンス イベントに関与しているかどうかを判断できます。
-
オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。
-
新規、確認済み、または廃止のパフォーマンス イベントが存在する必要があります。
-
イベントに関する情報を表示するには、「イベントの詳細」ページを表示します。
-
*説明*を読んでください。そこには、イベントに関係するワークロードと競合しているクラスター コンポーネントが説明されています。
競合状態のクラスタ コンポーネントによってレイテンシが影響を受けたVictimボリュームが複数あります。障害ディスクをスペア ディスクと交換するためにRAIDの再構築を実行中のアグリゲートが、競合状態のクラスタ コンポーネントです。[競合しているコンポーネント]の下にアグリゲート アイコンが赤で強調表示され、かっこ内にアグリゲートの名前が表示されます。
-
ワークロード使用率チャートで、*Bully ワークロード*を選択します。
-
グラフにカーソルを合わせると、コンポーネントに影響を与えている上位のBullyワークロードが表示されます。
イベントの検出以降、最大利用率が最も高い上位のワークロードがグラフの最上位に表示されます。上位のワークロードの1つはシステム定義のワークロード「Disk Health」です。これはRAIDの再構築を示しています。再構築は、スペア ディスクを使用してアグリゲートを再構築する内部プロセスです。Disk Healthワークロードとこのアグリゲートの他のワークロードが組み合わされて、アグリゲートでの競合および関連するイベントを引き起こした可能性があります。
-
Disk Healthワークロードのアクティビティがイベントの原因であることを確認したら、再構築が完了し、Unified Managerがイベントを分析してアグリゲートが引き続き競合状態にあるかを検出するまで約30分待ちます。
-
*イベントの詳細*を更新します。
RAIDの再構築が完了したら、[状態]が「廃止」になったことを確認します。これは、イベントが解決されたことを示します。
-
ワークロード使用率チャートで、「Bully ワークロード」を選択し、ピーク使用率別に集計上のワークロードを表示します。
-
*推奨アクション*領域で、上位のワークロードの*ワークロードの分析*ボタンをクリックします。
-
ワークロード分析 ページで、選択したボリュームの過去 24 時間 (1 日) のデータが表示されるように時間範囲を設定します。
イベントタイムラインでは、赤い点(
) は、ディスク障害イベントが発生した時刻を示します。
-
[ノードとアグリゲートの利用率]グラフで、ノード統計の行を非表示にし、アグリゲートの行だけを表示します。
-
このグラフのデータを、Latency グラフのイベント発生時のデータと比較します。
[アグリゲート利用率]では、イベント発生時にRAIDの再構築プロセスが原因の多数の読み取り / 書き込みアクティビティが表示されており、これが選択したボリュームのレイテンシ増加につながりました。イベント発生の数時間後には、読み取り / 書き込みとレイテンシの両方が減少し、アグリゲートの競合状態は解消しました。