アラートの監視(プレビュー)

StorageGRID 11.3リリースでプレビュー版として提供されているアラート システムは、StorageGRIDの運用中に発生する問題を検出、評価、解決するための使いやすいインターフェイスを備えています。

アラート システムには、アラーム システムに比べて大きなメリットがあります。
  • アラート システムはシステムの実際の問題を対象としています。従来のシステムのアラームとは異なり、新しいアラートは、無視しても安全なイベントではトリガーされず、すぐに対処が必要なイベントでトリガーされます。
  • 同じ種類の複数のアラートが1通のEメールにまとめられるため、通知の数が削減されます。また、[Alerts]ページでは同じ種類の複数のアラートが1つのグループとして表示されます。アラート グループを展開または縮小することで、個々のアラートの表示と非表示を切り替えることができます。たとえば、複数のノードから「Low installed node memory」アラートが報告された場合は、Eメールが1通だけ送信され、[Alerts]ページにそのアラートがグループとして表示されます。
    [Alerts]ページ
  • [Alerts]ページには、現在発生している問題がわかりやすく表示されます。リストは、個々のアラートやアラート グループでソートできます。たとえば、すべてのアラートをノード / サイトでソートして、特定のノードに影響しているアラートを確認できます。あるいは、グループ内のアラートを時間でソートして、特定のアラートの最新のインスタンスを確認することもできます。
  • アラートには、問題の内容を迅速に理解できるように、わかりやすい名前と説明が使用されます。アラート通知には、影響を受けるノードとサイトの詳細、アラートの重大度、アラート ルールがトリガーされたタイミング、アラートに関連する指標の現在の値が記載されます。
  • アラート通知および[Alerts]ページのアラート リストには、アラートを解決するための推奨される対処方法が記載されます。こうした対処方法の多くには、StorageGRIDドキュメント センターへの直接リンクが付記されており、さらに詳しいトラブルシューティング手順を容易に見つけてアクセスできるようになっています。
    [Alerts]ページ - 詳細モード
  • あるアラートのいくつかの重大度の通知を一時的に停止する必要がある場合は、特定のアラート ルールを簡単に一定期間サイレント化することができます。アラート ルールは、グリッド全体、単一サイト、または単一ノードでサイレント化できます。この新しいサイレンス機能は、アラーム システムの確認機能よりも充実しています。
  • カスタムのアラート ルールは、StorageGRIDの属性システムを使用してカスタム アラームを作成する場合に比べて、はるかに簡単に作成でき、機能性も優れています。環境に応じた特定の条件を対象にカスタムのアラート ルールを作成して、独自の対処方法を提供できます。カスタム アラートの条件を定義するには、グリッド管理APIの[Metrics]セクションのPrometheus指標を使用して式を作成します。

    たとえば次の式では、あるノードに搭載されたRAMの容量が24,000,000,000バイト(24GB)未満である場合にアラートがトリガーされます。

    node_memory_MemTotal < 24000000000