日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

ディスク障害が原因の動的なパフォーマンスイベントへの対処

11/11/2024

Unified Manager を使用して、アグリゲートを過剰に消費しているワークロードが原因のパフォーマンスイベントを調査できます。また、 Unified Manager を使用してアグリゲートの健常性を確認し、アグリゲートで検出された最近の健常性イベントがパフォーマンスイベントに関与しているかどうかを判断できます。

必要なもの *
オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。
新規、確認済み、または廃止状態のパフォーマンスイベントが発生している必要があります。

手順

イベントの詳細情報を表示するには、イベントの詳細 * ページを表示します。
イベントに関連するワークロードおよび競合状態のクラスタコンポーネントを示す * 概要 * を確認します。

競合状態のクラスタコンポーネントによってレイテンシが影響を受けたVictimボリュームが複数あります。障害ディスクをスペアディスクと交換するためにRAIDの再構築を実行中のアグリゲートが、競合状態のクラスタコンポーネントです。[Component in Contention]にある[Aggregate]アイコンが赤で強調表示され、かっこ内にアグリゲートの名前が表示されます。
ワークロード利用率グラフで、「 * Bully workloads * 」を選択します。
グラフにカーソルを合わせると、コンポーネントに影響を与えている上位のBullyワークロードが表示されます。

イベントの検出以降、最大利用率が最も高い上位のワークロードがグラフの最上位に表示されます。上位のワークロードの1つはシステム定義のワークロード「Disk Health」です。これはRAIDの再構築を示しています。再構築は、スペアディスクを使用してアグリゲートを再構築する内部プロセスです。Disk Healthワークロードとアグリゲートの他のワークロードが原因で、アグリゲートでの競合および関連イベントが発生している可能性があります。
Disk Health ワークロードのアクティビティがイベントの原因であることを確認したら、再構築が完了し、 Unified Manager がイベントを分析してアグリゲートが引き続き競合状態にあるかどうかを検出するまで約 30 分待ちます。
イベントの詳細を更新します。 *

RAIDの再構築が完了したら、イベントが解決されたことを示す「State」が「Obsolete」になっていることを確認します。
ワークロード利用率チャートで「 * Bully workloads * 」を選択して、アグリゲートのワークロードを最大利用率で表示します。
Suggested Actions * 領域で、上位のワークロードの * Analyze Workload * ボタンをクリックします。
[ ワークロード分析 * ] ページで、選択したボリュームの過去 24 時間（ 1 日）のデータを表示する時間範囲を設定します。

イベントタイムラインの赤いドット（）は、ディスク障害イベントが発生した時刻を示します。
[ノードとアグリゲートの利用率]グラフで、ノード統計の線を非表示にして、アグリゲートの線だけを表示します。
このグラフのデータを、イベント発生時の * レイテンシ * グラフのデータと比較します。

イベント発生時の[アグリゲート利用率]には、RAIDの再構築プロセスが原因の大量の読み取り/書き込みアクティビティが表示されており、これが選択したボリュームのレイテンシ増加につながりました。イベント発生の数時間後には、読み取り / 書き込みとレイテンシの両方が減少し、アグリゲートの競合状態は解消しました。

ディスク障害が原因の動的なパフォーマンスイベントへの対処

Creating your file...