システム アラートの表示

システムで発生したクラスタの障害やエラーに関する情報をアラートとして表示できます。アラートには、情報、警告、エラーがあり、クラスタの稼働状況を表すインジケータとして利用できます。ほとんどのエラーは自動的に解決します。

タスク概要

ListClusterFaults APIメソッドを使用すると、アラートの監視を自動化できます。このメソッドを使用すると、発生したすべてのアラートに関する通知が届きます。

手順

  1. Element UIで、[Reporting] > [Alerts]の順に選択します。
    ページ上のアラートは30秒ごとに更新されます。
    すべてのイベントについて次の情報が表示されます。
    項目 説明
    ID クラスタ アラートに関連付けられた一意のID。
    Severity アラートの重大度。有効な値は次のとおりです。
    • warning:近々対応が必要になる可能性があるが、深刻ではない問題です。システムのアップグレードは引き続き可能です。
    • error:パフォーマンスが低下したり高可用性(HA)が失われたりする可能性のある障害です。通常、サービスへのそれ以外の影響はありません。
    • critical:サービスに影響する深刻な障害です。システムは、API要求およびクライアントI/O要求を処理できません。この状態で運用を続けると、データが失われる可能性があります。
    • bestPractice:推奨されるシステム構成のベストプラクティスが使用されていません。
    Type エラーの影響を受けるコンポーネント。node、drive、cluster、service、volumeのいずれかです。
    Node このエラーに関連するノードのノードID。エラーのタイプがnodeとdriveの場合に表示され、それ以外の場合は「-」(ダッシュ)が表示されます。
    Drive ID このエラーに関連するドライブのドライブID。エラーのタイプがdriveの場合に表示され、それ以外の場合は「-」(ダッシュ)が表示されます。
    Error Code エラーの原因を示すコード。
    Details エラーの説明とその他の詳細情報。
    Date エラーがログに記録された日時。
  2. 個々のアラートの[Show Details]をクリックして、当該アラートに関する情報を表示します。
  3. ページ上のすべてのアラートの詳細を表示するには、[Details]列をクリックします。
    アラートが解決されると、そのアラートに関するすべての情報(解決された日付を含む)が[Resolved]領域に移動します。