HAテイクオーバーが原因の動的なパフォーマンス イベントへの対処

Unified Managerを使用して、ハイアベイラビリティ(HA)ペアを構成するクラスタ ノードでの大量のデータ処理が原因のパフォーマンス イベントを調査できます。また、Unified Managerを使用してノードの健全性を確認し、ノードで検出された最近の健全性イベントがパフォーマンス イベントに関与しているかどうかを判断できます。

開始する前に

手順

  1. [イベントの詳細]ページを表示してイベントに関する情報を確認します。
  2. [説明]に表示されているイベントに関連するワークロードおよび競合状態のクラスタ コンポーネントの説明を確認します。
    競合状態のクラスタ コンポーネントによってレイテンシが影響を受けたVictimボリュームが1つあります。パートナー ノードからすべてのワークロードをテイクオーバーしてデータを処理中のノードが、競合状態のクラスタ コンポーネントです。[競合しているコンポーネント]の下に[データ処理]アイコンが赤で強調表示され、イベント発生時にデータを処理していたノードの名前がかっこ内に表示されます。
  3. [説明]で、Victimボリュームの名前をクリックします。
    [パフォーマンス / ボリュームの詳細]ページが表示されます。ページの下部の[イベント]タイムラインで、変更イベントのアイコン(変更イベント アイコン)はUnified ManagerがHAテイクオーバーの開始を検出した時間を示しています。
  4. HAテイクオーバーの変更イベントのアイコンにカーソルを合わせます。
    Haテイクオーバーの詳細が[イベント]リスト テーブルに表示されます。[レイテンシ]グラフに表示されたイベントから、HAテイクオーバーと同じタイミングで発生した高レイテンシが原因で、選択したボリュームでパフォーマンスしきい値が超えたことがわかります。
  5. [データ内訳の基準]を選択します。
  6. [レイテンシ]で、[クラスタ コンポーネント]を選択します。
  7. [送信]をクリックします。
    [クラスタ コンポーネント]グラフが表示されます。このグラフには合計レイテンシのクラスタ コンポーネント別の内訳が表示されます。
  8. ページの下部で、HAテイクオーバーの開始の変更イベント アイコンにマウス カーソルを合わせます。
  9. [クラスタ コンポーネント]グラフで、データ処理のレイテンシを[レイテンシ]グラフの合計レイテンシと比較します。
    HAテイクオーバーの実行時に、データ処理ノードでワークロード需要が増加したためにデータ処理のレイテンシが急増しています。CPU利用率の増加によってレイテンシが増加し、イベントがトリガーされました。
  10. 障害が発生したノードを修復したあと、OnCommand System Managerを使用してHAギブバックを実行します。ワークロードはパートナー ノードから修復されたノードに移動します。
  11. HAギブバックが完了したら、Unified Managerで、手順2で記録したイベントIDを検索します。
    HAテイクオーバーによってトリガーされたイベントが[イベントの詳細]ページに表示されます。イベントの状態は廃止に変わっており、イベントが解決されたことがわかります。
  12. [説明]で、Victimボリュームの名前をクリックします。
    [パフォーマンス / ボリュームの詳細]ページが表示されます。ページ下部の[イベント]タイムラインで、変更イベントのアイコンが表示された場所がUnified ManagerがHAギブバックの完了を検出した時間です。
  13. [データ内訳の基準]を選択します。
  14. [レイテンシ]で、[クラスタ コンポーネント]を選択します。
    [クラスタ コンポーネント]グラフが表示されます。
  15. ページの下部で、HAギブバックの変更イベントのアイコンにカーソルを合わせます。
    変更イベントが[イベント]リスト テーブルで強調表示され、HAギブバックが正常に完了したことを示します。
  16. [クラスタ コンポーネント]グラフで、データ処理のレイテンシを[レイテンシ]グラフの合計レイテンシと比較します。
    データ処理コンポーネントでのレイテンシが低下し、その結果合計レイテンシも低下しています。選択したボリュームが現在データ処理に使用しているノードでイベントが解決されました。