日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

異常検出モニタ

11/25/2024 共同作成者

異常検出とは
異常検出はいつ必要ですか？
異常検出モニタの作成
異常の表示

異常検出では、テナント上のデータパターンの予期しない変化を分析できます。異常は、オブジェクトの動作のパターンが変化したときに発生します。たとえば、オブジェクトのレイテンシが水曜日のある時間に一定のレベルを超えていても、その次の水曜日のその時間にレイテンシが急増した場合、そのスパイクは異常とみなされます。Data Infrastructure Insightsでは、このような異常が発生したときにアラートを通知するモニタを作成できます。

異常検出は、予測可能な繰り返しパターンを示すオブジェクト指標に適しています。これらのオブジェクト指標が想定レベルを上回る、または下回ると、Data Infrastructure Insightsはアラートを生成して調査を促すことができます。

検出された異常を示すグラフ

異常検出とは

異常は、メトリックの平均値が、過去数週間のメトリックの加重平均からの標準偏差の数であり、最近の週の重みが前の週よりも大きい場合に発生します。Data Infrastructure Insightsは、データを監視し、異常の検出時にアラートを生成する機能を提供します。検出の「感度」レベルを設定することもできます。たとえば、平均値が平均からの標準偏差が少ない場合、より多くのアラートが生成されるようになります。逆に、感度が低い=平均からの標準偏差が多い=アラートの数が少ない。

異常検出の監視は、しきい値の監視とは異なります。

*しきい値ベースの監視*は、特定のメトリックのしきい値が事前に定義されている場合に機能します。言い換えれば、何が期待されるのか(つまり、通常の範囲内)を明確に理解しているときです。

測定値モニタは、動作範囲がわかっている場合に使用します。

*異常検出モニタリング*機械学習アルゴリズムを使用して、「正常」の定義が明確でない場合に、標準から逸脱する異常値を特定します。

異常検出モニタは、スパイクやドロップを確認する必要がある場合に使用します。

異常検出はいつ必要ですか？

異常検出の監視では、次のような多くの状況で役立つアラートが提供されます。

_normal_の定義が不明な場合。たとえば、ポートによっては、SANエラー率がさまざまに予想される場合があります。1つのエラーに関するアラートはノイズが多く、不要ですが、突然または大幅に増加した場合は、広範な問題が発生する可能性があります。
時間の経過とともに変化がある場所。季節的なワークロード（特定の時間にビジー状態または静かな状態）。これには、バッチの停止を示す可能性のある予期しない待機期間が含まれる可能性があります。
しきい値を手動で定義して調整することが現実的ではない大量のデータを扱う。たとえば、さまざまなワークロードのホストやボリュームが多数あるテナントなどです。SLAはそれぞれ異なる場合があるため、標準を超えるSLAを理解することが重要です。