クラスタ不均衡パフォーマンス イベントへの対処

Unified Managerは、クラスタ内の1つのノードの負荷が他のノードよりもはるかに高く、ワークロードのレイテンシに影響を及ぼしている可能性がある場合、クラスタ不均衡警告イベントを生成します。これらのシステム定義のイベントにより、多くのワークロードにレイテンシの影響が及ぶ前に潜在的な問題に対処することができます。

開始する前に

オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。

タスク概要

Unified Managerは、クラスタ内のすべてのノードの使用済みパフォーマンス容量の値を比較し、負荷の差が30%を超えるノードが見つかった場合、クラスタ不均衡しきい値ポリシーの違反とみなして警告イベントを生成します。

負荷の高いワークロードを利用率の低いノードに移動するには、以下に示す手順で次のリソースを特定します。

手順

  1. [イベントの詳細]ページを表示して、イベントの情報を確認します。
  2. 説明で、イベントの原因となったしきい値の違反に関する説明を確認します。
    たとえば、「使用済みパフォーマンス容量カウンタが、クラスタDallas-1-8のノード間で負荷に62%の差があることを示しており、システムしきい値30%を超えたため警告イベントがトリガーされました」というメッセージは、いずれかのノードのパフォーマンス容量の使用率が高く、ノードのパフォーマンスに影響を及ぼしていることを示しています。
  3. [推奨される操作]の内容を確認して、負荷の高いボリュームを使用済みパフォーマンス容量の値が高いノードから使用済みパフォーマンス容量の値が最も低いノードに移動します。
  4. 使用済みパフォーマンス容量の値が最も高いノードと最も低いノードを特定します。
    1. [イベント情報]セクションで、ソース クラスタの名前をクリックします。
    2. [クラスタ / パフォーマンス サマリ]ページで、[管理対象オブジェクト]領域の[ノード]をクリックします。
    3. [ノード]インベントリ ページで、[使用済みパフォーマンス容量]列でノードをソートします。
    4. 使用済みパフォーマンス容量の値が最も高いノードと最も低いノードを特定し、名前をメモします。
  5. 使用済みパフォーマンス容量の値が最も高いノードでIOPSが最も高いボリュームを特定します。
    1. 使用済みパフォーマンス容量の値が最も高いノードをクリックします。
    2. [ノード / パフォーマンス エクスプローラ]ページで、[表示して比較]メニューから[このノードのアグリゲート]を選択します。
    3. 使用済みパフォーマンス容量の値が最も高いアグリゲートをクリックします。
    4. [アグリゲート / パフォーマンス エクスプローラ]ページで、[表示して比較]メニューから[このアグリゲートのボリューム]を選択します。
    5. [IOPS]列でボリュームをソートし、IOPSが最も高いボリュームの名前とそのボリュームが配置されているアグリゲートの名前をメモします。
  6. 使用済みパフォーマンス容量の値が最も低いノードの使用率が最も低いボリュームを特定します。
    1. [ストレージ] > [アグリゲート]をクリックして[アグリゲート]インベントリ ページを表示します。
    2. [パフォーマンス:すべてのアグリゲート]ビューを選択します。
    3. [フィルタ]ボタンをクリックし、「ノード」の値が手順4でメモした使用済みパフォーマンス容量の値が最も低いノードの名前と等しくなるフィルタを追加します。
    4. 使用済みパフォーマンス容量の値が最も低いアグリゲートの名前をメモします。
  7. 新しいノードの使用率が低いアグリゲートに過負荷のノードからボリュームを移動します。
    移動処理は、ONTAP System ManagerOnCommand Workflow Automation、ONTAPコマンド、またはこれらのツールの組み合わせを使用して実行できます。

終了後の操作

数日後、このクラスタから同じクラスタ不均衡イベントを受け取っていないかを確認します。