日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

ディスク障害が原因の動的なパフォーマンスイベントへの対処

寄稿者

Unified Manager を使用して、アグリゲートを過剰に消費しているワークロードが原因のパフォーマンスイベントを調査できます。また、 Unified Manager を使用してアグリゲートの健常性を確認し、アグリゲートで検出された最近の健常性イベントがパフォーマンスイベントに関与しているかどうかを判断できます。

  • 必要なもの *

  • オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。

  • 新規、確認済み、または廃止状態のパフォーマンスイベントが存在する必要があります。

手順
  1. イベントの詳細情報を表示するには、イベントの詳細 * ページを表示します。

  2. イベントに関連するワークロードおよび競合状態のクラスタコンポーネントを示す * 概要 * を確認します。

    競合状態のクラスタコンポーネントによってレイテンシが影響を受けた Victim ボリュームが複数あります。障害ディスクをスペアディスクと交換するために RAID の再構築を実行中のアグリゲートが、競合状態のクラスタコンポーネントです。競合状態のコンポーネントの下にあるアグリゲートアイコンが赤で強調表示され、かっこ内にアグリゲートの名前が表示されます。

  3. ワークロード利用率グラフで、「 * Bully workloads * 」を選択します。

  4. グラフにカーソルを合わせると、コンポーネントに影響を与えている上位の Bully ワークロードが表示されます。

    イベントの検出以降、最大利用率が最も高い上位のワークロードがグラフの最上位に表示されます。上位のワークロードの 1 つはシステム定義のワークロード「 Disk Health 」です。これは RAID の再構築を示しています。再構築は、スペアディスクを使用してアグリゲートを再構築する内部プロセスです。Disk Health ワークロードとアグリゲートの他のワークロードが原因で、アグリゲートの競合および関連するイベントが発生した可能性があります。

  5. Disk Health ワークロードのアクティビティがイベントの原因であることを確認したら、再構築が完了し、 Unified Manager がイベントを分析してアグリゲートが引き続き競合状態にあるかどうかを検出するまで約 30 分待ちます。

  6. イベントの詳細を更新します。 *

    RAID の再構築が完了したら、状態が「廃止」になっていることを確認します。これは、イベントが解決したことを示します。

  7. ワークロード利用率チャートで「 * Bully workloads * 」を選択して、アグリゲートのワークロードを最大利用率で表示します。

  8. Suggested Actions * 領域で、上位のワークロードの * Analyze Workload * ボタンをクリックします。

  9. [ ワークロード分析 * ] ページで、選択したボリュームの過去 24 時間( 1 日)のデータを表示する時間範囲を設定します。

    イベントタイムラインで、赤い点(Performance Manager のインシデントアイコン)ディスク障害イベントが発生したタイミングを示します。

  10. ノードとアグリゲートの利用率チャートで、ノードの統計の線を非表示にして、アグリゲートの線だけを表示します。

  11. このグラフのデータを、イベント発生時の * レイテンシ * グラフのデータと比較します。

    イベントが発生すると、アグリゲート利用率には、 RAID の再構築プロセスが原因の読み取りおよび書き込みアクティビティの量が多く表示されます。これにより、選択したボリュームのレイテンシが増加します。イベント発生の数時間後には、読み取り / 書き込みとレイテンシの両方が減少し、アグリゲートの競合状態は解消しました。