日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

アラートの管理:概要

寄稿者

アラートを使用すると、 StorageGRID システム内のさまざまなイベントや状態を監視できます。アラートの管理では、カスタムアラートの作成、デフォルトアラートの編集または無効化、アラート用の E メール通知の設定、アラート通知のサイレント化を行うことができます。

StorageGRID アラートについて

アラートシステムでは、 StorageGRID の運用中に発生する問題を、使いやすいインターフェイスを通じて検出し、評価し、解決することができます。

  • アラートシステムは、システムで実行可能な問題に焦点を当てます。アラートは、無視しても安全なイベントではなく、すぐに対処が必要なイベントに対してトリガーされます。

  • Current Alerts (現在のアラート)ページには、現在の問題を表示するための使いやすいインターフェイスが用意されています。リストは、個々のアラートやアラートグループでソートできます。たとえば、すべてのアラートをノード / サイトでソートして、特定のノードに影響しているアラートを確認できます。または、グループ内のアラートを時間でソートして、特定のアラートの最新のインスタンスを確認することもできます。

  • 解決済みアラートページには、現在のアラートページと同様の情報が表示されますが、アラートがトリガーされた日時や解決された日時など、解決済みのアラートの履歴を検索して表示することができます。

  • 同じ種類の複数のアラートが 1 つの E メールにグループ化され、通知の数が削減されます。また、同じタイプの複数のアラートが [Alerts] ページにグループとして表示されます。アラートグループを展開または縮小すると、個々のアラートの表示と非表示を切り替えることができます。たとえば、複数のノードから「 Unable to communicate with node * 」アラートがほぼ同時に報告された場合、送信される E メールは 1 通だけで、アラートは Alerts ページのグループとして表示されます。

  • アラートには、問題をすばやく把握できるように、わかりやすい名前と説明が使用されています。アラート通知には、影響を受けるノードとサイトに関する詳細、アラートの重大度、アラートルールがトリガーされた時刻、およびアラートに関連する指標の現在の値が含まれます。

  • アラート E メール通知および現在のアラートおよび解決済みアラートのページに表示されるアラートリストは、アラートを解決するための推奨される対処方法を提供します。これらの対処方法には、 StorageGRID ドキュメントセンターへの直接リンクが含まれていることが多く、より詳細なトラブルシューティング手順を見つけてアクセスしやすくなっています。

  • 1 つ以上の重大度のアラートの通知を一時的に停止する必要がある場合は、特定のアラートルールを簡単に一定期間、およびグリッド全体、単一サイト、または単一ノードでサイレント化することができます。また、ソフトウェアアップグレードなどの計画的なメンテナンス手順 の実行中など、すべてのアラートルールをサイレント化することもできます。

  • 必要に応じてデフォルトのアラートルールを編集できます。アラートルールは完全に無効にすることも、トリガー条件と期間を変更することもできます。

  • 環境に応じた特定の条件を対象にカスタムのアラートルールを作成して、独自の対処方法を提供できます。カスタムアラートの条件を定義するには、グリッド管理 API の指標セクションで使用できる Prometheus 指標を使用して式を作成します。

詳細はこちら。