HAテイクオーバーによって発生する動的なパフォーマンスイベントに対応する
Unified Managerを使用して、ハイアベイラビリティ(HA)ペアを構成するクラスタ ノードでの大量のデータ処理が原因のパフォーマンス イベントを調査できます。また、Unified Managerを使用してノードの健全性を確認し、ノードで検出された最近の健全性イベントがパフォーマンス イベントに関与しているかどうかを判断できます。
-
オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。
-
新規、確認済み、または廃止のパフォーマンス イベントが存在する必要があります。
-
イベントに関する情報を表示するには、「イベントの詳細」ページを表示します。
-
*説明*を読んでください。そこには、イベントに関係するワークロードと競合しているクラスター コンポーネントが説明されています。
競合状態のクラスタ コンポーネントによってレイテンシが影響を受けたVictimボリュームが1つあります。パートナー ノードからすべてのワークロードをテイクオーバーしてデータを処理中のノードが、競合状態のクラスタ コンポーネントです。[競合しているコンポーネント]の下に[データ処理]アイコンが赤で強調表示され、イベント発生時にデータを処理していたノードの名前がかっこ内に表示されます。
-
*説明*で、ボリュームの名前をクリックします。
ボリュームの[パフォーマンス エクスプローラ]ページが表示されます。ページ上部のイベントタイムラインに、イベント変更アイコン(
)は、Unified Manager が HA テイクオーバーの開始を検出した時刻を示します。
-
HAテイクオーバーの変更イベント アイコンにカーソルを合わせます。HAテイクオーバーの詳細がホバー テキストで表示されます。
[レイテンシ]グラフに表示されたイベントから、HAテイクオーバーと同じタイミングで発生した高レイテンシが原因で、選択したボリュームでパフォーマンスしきい値が超えたことがわかります。
-
*ズーム表示*をクリックすると、新しいページにレイテンシ チャートが表示されます。
-
[表示] メニューで [クラスター コンポーネント] を選択して、クラスター コンポーネントごとの合計レイテンシを表示します。
-
HAテイクオーバーの開始を示す変更イベント アイコンにマウス カーソルを合わせ、データ処理のレイテンシを合計レイテンシと比較します。
HAテイクオーバーの実行時に、データ処理ノードでワークロード需要が増加したためにデータ処理のレイテンシが急増しています。CPU利用率の増加によってレイテンシが増加し、イベントがトリガーされました。
-
障害が発生したノードを修復したあと、ONTAP System Managerを使用してHAギブバックを実行します。ワークロードはパートナー ノードから修復されたノードに移動します。
-
HA ギブバックが完了したら、Unified Manager で次の構成検出 (約 15 分後) を行った後、イベント管理 インベントリ ページで HA テイクオーバーによってトリガーされたイベントとワークロードを見つけます。
HAテイクオーバーによってトリガーされたイベントの状態が「廃止」になり、イベントが解決されたことを確認できます。データ処理コンポーネントでのレイテンシが低下し、その結果合計レイテンシも低下しています。選択したボリュームが現在データ処理に使用しているノードでイベントが解決されました。