システム定義のパフォーマンスしきい値ポリシーのタイプ
Unified Manager には、クラスタのパフォーマンスを監視し、イベントを自動生成する標準のしきい値ポリシーがいくつか用意されています。これらのポリシーはデフォルトで有効になっており、監視対象のパフォーマンスしきい値を超えたときに警告イベントまたは情報イベントを生成します。
システム定義のパフォーマンスしきい値ポリシーは、 Cloud Volumes ONTAP 、 ONTAP Edge 、 ONTAP Select の各システムでは無効です。 |
システム定義のパフォーマンスしきい値ポリシーから不要なイベントが送られてくる場合は、Configuration/Manage Eventsページから個 々 のポリシーを無効にできます。
ノードのしきい値ポリシー
システム定義のノードパフォーマンスしきい値ポリシーは、 Unified Manager で監視されているクラスタ内の各ノードにデフォルトで割り当てられます。
-
利用率の高いノードリソース
1 つのノードが運用効率の上限を超えて稼働していて、ワークロードのレイテンシに影響を及ぼしている可能性がある状況を特定します。これは警告イベントです。
ONTAP 8.3.x以前のソフトウェアがインストールされているノードの場合、85%以上のCPUリソースとRAMリソース(ノード利用率)を30分以上使用しているノードが特定されます。
ONTAP 9.0以降のソフトウェアがインストールされているノードの場合、100%以上のパフォーマンス容量を30分以上使用しているノードが特定されます。
-
* 利用率の高いノード HA ペア *
HA ペアのノードが HA ペアの運用効率の上限を超えて稼働している状況を特定します。これは情報イベントです。
ONTAP 8.3.x以前のソフトウェアがインストールされているノードの場合、HAペアの2つのノードのCPUとRAMの使用量が確認されます。2つのノードのノード利用率の合計が1時間以上にわたって140%を超えている場合は、コントローラフェイルオーバーがワークロードのレイテンシに影響を及ぼします。
ONTAP 9.0以降のソフトウェアがインストールされているノードの場合、HAペアの2つのノードの使用済みパフォーマンス容量の値が確認されます。2つのノードの使用済みパフォーマンス容量の合計が1時間以上にわたって200%を超えている場合は、コントローラフェイルオーバーがワークロードのレイテンシに影響を及ぼします。
-
* ノードディスクの断片化 *
アグリゲート内の 1 つまたは複数のディスクが断片化されていて、主要なシステムサービスの速度が低下し、ノード上のワークロードのレイテンシに影響を及ぼしている可能性がある状況を特定します。
ノード上のすべてのアグリゲートで特定の読み取り / 書き込み処理の比率が確認されます。このポリシーは、 SyncMirror の再同期中、またはディスクスクラビング処理中にエラーが検出されたときにもトリガーされることがあります。これは警告イベントです。
「ノードディスクの断片化」ポリシーは、 HDD のみのアグリゲートを分析します。 Flash Pool 、 SSD 、および FabricPool の各アグリゲートは分析しません。
アグリゲートのしきい値ポリシー
システム定義のアグリゲートパフォーマンスしきい値ポリシーは、Unified Managerで監視されているクラスタ内の各アグリゲートにデフォルトで割り当てられます。
-
* 利用率の高いアグリゲートディスク *
アグリゲートが運用効率の上限を超えて稼働していて、ワークロードのレイテンシに影響を及ぼしている可能性がある状況を特定します。そのために、アグリゲート内のディスクの利用率が 30 分以上にわたって 95% を超えているアグリゲートが特定されます。この複数条件のポリシーでは、次に示す分析を実行して、問題の原因を特定します。
-
アグリゲート内のディスクがバックグラウンドでメンテナンス作業を実行中かどうか。
ディスクに対してバックグラウンドで実行されるメンテナンス作業には、ディスク再構築、ディスクスクラビング、 SyncMirror の再同期、再パリティ化などがあります。
-
ディスクシェルフの Fibre Channel インターコネクトに通信のボトルネックはあるか。
-
アグリゲートの空きスペースが不足しているか。3 つの下位ポリシーのうちの 1 つ(または複数)にも違反しているとみなされた場合にのみ、このポリシーに対して警告イベントが発行されます。アグリゲート内のディスクの利用率が 95% を超えているだけであれば、パフォーマンスイベントはトリガーされません。
-
「利用率の高いディスクを集約」ポリシーは、 HDD のみのアグリゲートと Flash Pool (ハイブリッド)アグリゲートを分析します。 SSD アグリゲートと FabricPool アグリゲートは分析しません。 |
QoS のしきい値ポリシー
システム定義のQoSパフォーマンスしきい値ポリシーは、ONTAP のQoS最大スループットポリシー(IOPS、IOPS/TB、またはMBps)が設定されているワークロードに割り当てられます。ワークロードのスループットの値が設定されたQoS値を15%下回ると、Unified Managerはイベントをトリガーします。
-
* QoS最大IOPSまたはQoS最大MBpsしきい値*
IOPSまたはMBpsがQoS最大スループット制限を超えていて、ワークロードのレイテンシに影響を及ぼしているボリュームおよびLUNを特定します。これは警告イベントです。
ポリシーグループにワークロードが 1 つしか割り当てられていない場合、割り当てられている QoS ポリシーグループで定義された最大スループットしきい値を超えているワークロードが過去 1 時間の各収集期間にないかどうかが確認されます。
複数のワークロードで同じQoSポリシーを使用している場合は、ポリシーに割り当てられたすべてのワークロードのIOPSまたはMBpsの合計が求められ、その合計がしきい値を超えていないかどうかが確認されます。
-
* QoS ピーク IOPS/TB またはブロックサイズしきい値 *
IOPS/TB がアダプティブ QoS ピークスループット制限(またはブロックサイズ指定の IOPS/TB 制限)を超えていて、ワークロードのレイテンシに影響を及ぼしているボリュームを特定します。これは警告イベントです。
このポリシーでは、アダプティブ QoS ポリシーで定義された IOPS/TB のピークしきい値を各ボリュームのサイズに基づいて QoS 最大 IOPS の値に変換し、過去 1 時間の各パフォーマンス収集期間に QoS 最大 IOPS を超えているボリュームを探します。
このポリシーは、クラスタに ONTAP 9.3 以降のソフトウェアがインストールされている場合にのみボリュームに適用されます。
アダプティブQoSポリシーに「block size」要素が定義されている場合、しきい値は各ボリュームのサイズに基づいてQoSの最大MBpsの値に変換されます。過去1時間の各パフォーマンス収集期間にこの値を超えているボリュームがないかどうかが確認されます。
このポリシーは、クラスタに ONTAP 9.5 以降のソフトウェアがインストールされている場合にのみボリュームに適用されます。