ディスク障害が原因の動的なパフォーマンスイベントへの対処
Unified Manager を使用して、アグリゲートを過剰に消費しているワークロードが原因のパフォーマンスイベントを調査できます。また、 Unified Manager を使用してアグリゲートの健常性を確認し、アグリゲートで検出された最近の健常性イベントがパフォーマンスイベントに関与しているかどうかを判断できます。
-
必要なもの *
-
オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。
-
新規、確認済み、または廃止状態のパフォーマンスイベントが発生している必要があります。
-
イベントの詳細情報を表示するには、イベントの詳細 * ページを表示します。
-
イベントに関連するワークロードおよび競合状態のクラスタコンポーネントを示す * 概要 * を確認します。
競合状態のクラスタコンポーネントによってレイテンシが影響を受けたVictimボリュームが複数あります。障害ディスクをスペアディスクと交換するためにRAIDの再構築を実行中のアグリゲートが、競合状態のクラスタコンポーネントです。[Component in Contention]にある[Aggregate]アイコンが赤で強調表示され、かっこ内にアグリゲートの名前が表示されます。
-
ワークロード利用率グラフで、「 * Bully workloads * 」を選択します。
-
グラフにカーソルを合わせると、コンポーネントに影響を与えている上位のBullyワークロードが表示されます。
イベントの検出以降、最大利用率が最も高い上位のワークロードがグラフの最上位に表示されます。上位のワークロードの1つはシステム定義のワークロード「Disk Health」です。これはRAIDの再構築を示しています。再構築は、スペアディスクを使用してアグリゲートを再構築する内部プロセスです。Disk Healthワークロードとアグリゲートの他のワークロードが原因で、アグリゲートでの競合および関連イベントが発生している可能性があります。
-
Disk Health ワークロードのアクティビティがイベントの原因であることを確認したら、再構築が完了し、 Unified Manager がイベントを分析してアグリゲートが引き続き競合状態にあるかどうかを検出するまで約 30 分待ちます。
-
イベントの詳細を更新します。 *
RAIDの再構築が完了したら、イベントが解決されたことを示す「State」が「Obsolete」になっていることを確認します。
-
ワークロード利用率チャートで「 * Bully workloads * 」を選択して、アグリゲートのワークロードを最大利用率で表示します。
-
Suggested Actions * 領域で、上位のワークロードの * Analyze Workload * ボタンをクリックします。
-
[ ワークロード分析 * ] ページで、選択したボリュームの過去 24 時間( 1 日)のデータを表示する時間範囲を設定します。
イベントタイムラインの赤いドット()は、ディスク障害イベントが発生した時刻を示します。
-
[ノードとアグリゲートの利用率]グラフで、ノード統計の線を非表示にして、アグリゲートの線だけを表示します。
-
このグラフのデータを、イベント発生時の * レイテンシ * グラフのデータと比較します。
イベント発生時の[アグリゲート利用率]には、RAIDの再構築プロセスが原因の大量の読み取り/書き込みアクティビティが表示されており、これが選択したボリュームのレイテンシ増加につながりました。イベント発生の数時間後には、読み取り / 書き込みとレイテンシの両方が減少し、アグリゲートの競合状態は解消しました。