ノード リソース過剰使用パフォーマンス イベントへの対処

1つのノードが運用効率の上限を超えて稼働していて、ワークロードのレイテンシに影響を及ぼしている可能性がある場合、Unified Managerでノード リソース過剰使用警告イベントが生成されます。これらのシステム定義のイベントにより、多くのワークロードにレイテンシの影響が及ぶ前に潜在的な問題に対処することができます。

開始する前に

タスク概要

Unified Managerでは、パフォーマンス容量の使用率が30分以上にわたって100%を超えているノードが見つかると、ノード リソース過剰使用ポリシーの違反とみなして警告イベントを生成します。

このタイプのパフォーマンスの問題には、System ManagerまたはONTAPコマンドを使用して次のように対処できます。
  • QoSポリシーを作成してシステム リソースの使用率が高いボリュームやLUNに適用する。
  • ワークロードが適用されているポリシー グループのQoSの最大スループット制限を小さくする。
  • ワークロードを別のアグリゲートやノードに移動する。
  • ノードにディスクを追加するか、ノードのCPUやRAMをアップグレードして、ノードの容量を増やす。

手順

  1. [イベントの詳細]ページを表示して、イベントの情報を確認します。
  2. 説明で、イベントの原因となったしきい値の違反に関する説明を確認します。
    たとえば、「simplicity-02 の使用済みパフォーマンス容量が 139% のため、警告イベントがトリガーされました。データ処理装置にパフォーマンスの問題がある可能性があります。」というメッセージは、ノードsimplicity-02のパフォーマンス容量の使用率が高く、ノードのパフォーマンスに影響を及ぼしていることを示しています。
  3. [システム診断]セクションで、ノードの使用済みパフォーマンス容量を示すグラフ、上位のワークロードの平均ストレージIOPSを示すグラフ、および上位のワークロードのレイテンシを示すグラフの3つを確認します。このように表示することで、ノードのレイテンシの原因となっているワークロードを特定することができます。
    IOPSグラフにカーソルを合わせると、QoSポリシーが適用されているワークロードと適用されていないワークロードを確認できます。
  4. [推奨される操作]セクションで、推奨される対処方法を確認し、ワークロードのレイテンシの増大を防ぐための処理を判断します。
    [ヘルプ]ボタンをクリックすると、パフォーマンス イベントを解決するための推奨される対処方法に関する詳細を必要に応じて確認できます。