OnCommand Insightの異常検出の仕組み

OnCommand Insightには、機械学習に基づく異常検出分析機能が搭載されています。アプリケーションのインフラを監視し、サービスの中断を引き起こす前にパフォーマンスの異常を特定することができます。

異常分析は、アプリケーションの通常運用時のワークロードの範囲を特定し、パフォーマンスの変化が想定外のレベルであった場合に通知する機能です。アプリケーションの異常検出エンジンは、Insightで収集されたパフォーマンス指標を取り込んで、アプリケーション インフラにおける異常を検出します。

異常検出には次のような機能があります。
異常検出エンジンは、Insightのデータを使用してアプリケーションを分析します。最初に監視を開始するときに、最大で過去14日分のパフォーマンス データを分析エンジンに取り込むことができます。数週間から数カ月とデータを収集していくことで、特定のリソースに関するより正確なデータが得られるようになります。データには次のカウンタの合計が含まれます。
オブジェクト カウンタ
VM レイテンシ、IOPS
ハイパーバイザー CPU利用率、IOPS
エッジ ポート バッファ間クレジット ゼロ
ストレージ ノード レイテンシ、利用率、IOPS
ボリューム レイテンシ、IOPS
内部ボリューム レイテンシ、IOPS
ストレージ プール IOPS、利用率

Insightサーバでパフォーマンス データのアーカイブ機能が有効になっている場合は、異常検出エンジンで収集されたデータがアーカイブされます。アーカイブ機能が有効になっているかどうかは、[System Health]ページで確認できます。

異常検出エンジンは、Insightサーバとは別のサーバで実行されます。この設定は物理マシンまたはVMで行えます。詳細については、『OnCommand Insight Installation Guide for Windows or Linux』を参照してください。