HAテイクオーバーが原因の動的なパフォーマンスイベントへの対処
Unified Managerを使用して、ハイアベイラビリティ(HA)ペアを構成するクラスタノードでの高Data Processingが原因のパフォーマンスイベントを調査できます。また、 Unified Manager を使用してノードの健全性を確認し、ノードで検出された最近の健全性イベントがパフォーマンスイベントに関与しているかどうかを判断できます。
-
必要なもの *
-
オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。
-
新規、確認済み、または廃止状態のパフォーマンスイベントが発生している必要があります。
-
イベントの詳細情報を表示するには、イベントの詳細 * ページを表示します。
-
イベントに関連するワークロードおよび競合状態のクラスタコンポーネントを示す * 概要 * を確認します。
競合状態のクラスタコンポーネントによってレイテンシが影響を受けたVictimボリュームが1つあります。パートナーノードからすべてのワークロードをテイクオーバーしたData Processingノードが、競合状態のクラスタコンポーネントです。[Component in Contention]の下にData Processingアイコンが赤で強調表示され、イベント発生時にData Processingを処理していたノードの名前がかっこ内に表示されます。
-
概要 * で、ボリュームの名前をクリックします。
ボリュームパフォーマンスエクスプローラページが表示されます。ページ上部の[Events]タイムラインにある変更イベントアイコン()は、Unified ManagerがHAテイクオーバーの開始を検出した時刻を示します。
-
HAテイクオーバーの変更イベントアイコンにカーソルを合わせると、HAテイクオーバーの詳細がホバーテキストで表示されます。
[レイテンシ]グラフでは、HAテイクオーバーと同じタイミングで高レイテンシが原因で、選択したボリュームがパフォーマンスしきい値を超えたことを示すイベントが表示されます。
-
新しいページにレイテンシグラフを表示するには、 * Zoom View * をクリックします。
-
表示メニューでクラスタコンポーネント * を選択し、クラスタコンポーネント別の合計レイテンシを表示します。
-
HAテイクオーバーの開始を示す変更イベントアイコンにマウスカーソルを合わせ、Data Processingのレイテンシを合計レイテンシと比較します。
HAテイクオーバーの実行時に、Data Processingノードでのワークロード需要の増加に起因するData Processingの急増がありました。CPU利用率の上昇によってレイテンシが上昇し、イベントがトリガーされました。
-
障害ノードを修正したら、ONTAP System Managerを使用してHAギブバックを実行します。これにより、ワークロードがパートナーノードから固定ノードに移動されます。
-
HA ギブバックが完了したら、 Unified Manager での次回の構成の検出のあと(約 15 分後)に、 HA テイクオーバーによってトリガーされたイベントとワークロードを「 * Event Management * 」インベントリページで確認します。
HAテイクオーバーによってトリガーされたイベントの状態が「廃止」になり、イベントが解決されたことを示します。データ処理コンポーネントでのレイテンシが低下し、その結果合計レイテンシも低下しています。選択したボリュームが現在データ処理に使用しているノードでイベントが解決されました。