ディスク障害が原因の動的なパフォーマンスイベントへの対処
Unified Manager を使用して、アグリゲートを過剰に消費しているワークロードが原因のパフォーマンスイベントを調査できます。また、 Unified Manager を使用してアグリゲートの健常性を確認し、アグリゲートで検出された最近の健常性イベントがパフォーマンスイベントに関与しているかどうかを判断できます。
作業を開始する前に
-
オペレータ、OnCommand 管理者、またはストレージ管理者のロールが必要です。
-
新規、確認済み、または廃止状態のパフォーマンスイベントが存在する必要があります。
手順
-
イベントの詳細情報を表示するには、イベントの詳細 * ページを表示します。
-
イベントに関連するワークロードおよび競合状態のクラスタコンポーネントを示す * 概要 * を確認します。
競合状態のクラスタコンポーネントによってレイテンシが影響を受けた Victim ボリュームが複数あります。障害ディスクをスペアディスクと交換するために RAID の再構築を実行中のアグリゲートが、競合状態のクラスタコンポーネントです。競合状態のコンポーネントの下にあるアグリゲートアイコンが赤で強調表示され、かっこ内にアグリゲートの名前が表示されます。
-
ワークロード利用率グラフで、「 * Bully workloads * 」を選択します。
-
グラフにカーソルを合わせると、コンポーネントに影響を与えている上位の Bully ワークロードが表示されます。
イベントの検出以降、最大利用率が最も高い上位のワークロードがグラフの最上位に表示されます。上位のワークロードの 1 つはシステム定義のワークロード「 Disk Health 」です。これは RAID の再構築を示しています。再構築は、スペアディスクを使用してアグリゲートを再構築する内部プロセスです。Disk Health ワークロードとアグリゲートの他のワークロードが原因で、アグリゲートの競合および関連するイベントが発生した可能性があります。
-
Disk Health ワークロードのアクティビティがイベントの原因であることを確認したら、再構築が完了し、 Unified Manager がイベントを分析してアグリゲートが引き続き競合状態にあるかどうかを検出するまで約 30 分待ちます。
-
Unified Managerで、手順2で記録したイベントIDを検索します。
ディスク障害のイベントがイベントの詳細ページに表示されます。RAID の再構築が完了したら、状態が「廃止」になっていることを確認します。これは、イベントが解決したことを示します。
-
ワークロード利用率チャートで「 * Bully workloads * 」を選択して、アグリゲートのワークロードを最大利用率で表示します。
-
上位のワークロードの「パフォーマンス/ボリュームの詳細」ページに移動します。
-
[*1d]をクリックすると、選択したボリュームの過去24時間(1日)のデータが表示されます。
レイテンシグラフに赤い点()ディスク障害イベントが発生したタイミングを示します。
-
[*データを次の単位でブレークダウンする]を選択します。
-
[Components]で、[ディスク使用率]を選択します。
-
[Submit (送信) ] をクリックします。
ディスク利用率チャートには、選択したワークロードからターゲットアグリゲートのディスクへのすべての読み取り要求と書き込み要求のグラフが表示されます。
-
ディスク利用率*グラフのデータを、イベント発生時の*レイテンシ*グラフのデータと比較します。
ディスク利用率には、イベント発生時にRAIDの再構築プロセスが原因の読み取りおよび書き込みアクティビティが大量に表示され、これが選択したボリュームのレイテンシ増加につながりました。イベント発生の数時間後には、読み取り / 書き込みとレイテンシの両方が減少し、アグリゲートの競合状態は解消しました。