Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

アラート一覧

共同作成者

このリファレンスでは、Grid Managerに表示されるデフォルトアラートを示します。推奨される対処方法は、受信したアラートメッセージに記載されています。

必要に応じて、システムの管理方法に合わせてカスタムのアラートルールを作成できます。

一部のデフォルトアラートではが使用されます "Prometheus 指標"

アプライアンスのアラート

アラート名 説明

アプライアンスのバッテリの有効期間が終了し

アプライアンスのストレージコントローラのバッテリの有効期間が終了しました。

アプライアンスのバッテリに問題があります

アプライアンスのストレージコントローラのバッテリに障害が発生しました。

アプライアンスバッテリの学習容量が不足しています

アプライアンスのストレージコントローラのバッテリで学習容量が不足しています。

アプライアンスバッテリの有効期限が近づいています

アプライアンスのストレージコントローラのバッテリの有効期限が近づいています。

アプライアンスのバッテリが取り外されました

アプライアンスのストレージコントローラのバッテリがありません。

アプライアンスのバッテリが高温になっています

アプライアンスのストレージコントローラのバッテリが過熱しています。

アプライアンスの BMC 通信エラー

ベースボード管理コントローラ( BMC )との通信が失われました。

アプライアンスキャッシュバックアップデバイスに障害が発生しました

永続的キャッシュバックアップデバイスで障害が発生しました。

アプライアンスキャッシュバックアップデバイスに十分な容量がありません

キャッシュバックアップデバイスに十分な容量がありません。

アプライアンスのキャッシュ・バックアップ・デバイスの書き込み保護

キャッシュバックアップデバイスは書き込み保護されています。

アプライアンスのキャッシュメモリサイズが一致しません

アプライアンスの 2 台のコントローラは、キャッシュサイズが異なります。

アプライアンスコンピューティングコントローラシャーシの温度が高すぎます

StorageGRID アプライアンスのコンピューティングコントローラの温度が公称のしきい値を超えました。

アプライアンスのコンピューティングコントローラの CPU 温度が高すぎます

StorageGRID アプライアンスのコンピューティングコントローラの CPU 温度が公称のしきい値を超えました。

アプライアンスのコンピューティングコントローラを確認する必要があります

StorageGRID アプライアンスのコンピューティングコントローラでハードウェア障害が検出されました。

アプライアンスコンピューティングコントローラの電源装置 A に問題があります

コンピューティングコントローラの電源装置Aに問題があります。

アプライアンスコンピューティングコントローラの電源装置 B に問題があります

コンピューティングコントローラの電源装置 B に問題があります。

アプライアンスコンピューティングハードウェアモニタのサービスが停止する

ストレージハードウェアのステータスを監視するサービスが停止しました。

アプライアンスのDASドライブ障害が検出されました

アプライアンスの直接接続型ストレージ(DAS)ドライブで問題が検出されました。

アプライアンスDASドライブのリビルド

直接接続型ストレージ(DAS)ドライブのリビルド中。これは、最近交換または取り外し/再挿入された場合に想定される現象です。

アプライアンスのファン障害が検出されました

アプライアンスのファンユニットに問題が検出されました。

アプライアンスのファイバ・チャネル障害が検出されました

アプライアンスストレージコントローラとコンピューティングコントローラの間でFibre Channelリンクの問題が検出されました

アプライアンスのファイバ・チャネル HBA ポート障害

Fibre Channel HBA ポートで障害が発生しているか、障害が発生しています。

アプライアンスのフラッシュキャッシュドライブが最適な状態でありません

SSD キャッシュに使用されているドライブが最適な状態でありません。

アプライアンスインターコネクト / バッテリキャニスターが取り外されました

インターコネクト / バッテリキャニスターがありません。

アプライアンスの LACP ポートがありません

StorageGRID アプライアンスのポートが LACP ボンドに参加していません。

アプライアンスNICの障害が検出されました

アプライアンスのネットワークインターフェイスカード(NIC)に問題が検出されました。

アプライアンス全体の電源装置がデグレード状態になりました

StorageGRID アプライアンスの電源が、推奨される動作電圧から逸脱しています。

アプライアンスSSDの重大な警告です

アプライアンスSSDから重大な警告が報告されています。

アプライアンスストレージコントローラ A の障害

StorageGRID アプライアンスのストレージコントローラ A で障害が発生した。

アプライアンスストレージコントローラ B の障害

StorageGRID アプライアンスのストレージコントローラ B で障害が発生した。

アプライアンスストレージコントローラのドライブ障害

StorageGRID アプライアンスの 1 つ以上のドライブで障害が発生しているか、または最適な状態でありません。

アプライアンスストレージコントローラハードウェア問題

SANtricity ソフトウェアから、 StorageGRID アプライアンスのコンポーネントについて「 Needs Attention 」が報告されます。

アプライアンスストレージコントローラの電源装置 A に障害が発生しました

StorageGRID アプライアンスの電源装置 A が、推奨される動作電圧から逸脱しています。

アプライアンスストレージコントローラの電源装置 B に障害が発生しました

StorageGRID アプライアンスの電源装置 B が、推奨される動作電圧から逸脱しています。

アプライアンスストレージハードウェアモニタのサービスが停止する

ストレージハードウェアのステータスを監視するサービスが停止しました。

アプライアンスストレージシェルフがデグレード状態になります

ストレージアプライアンスのストレージシェルフのいずれかのコンポーネントのステータスがデグレードになっています。

アプライアンスの温度が超過しました

アプライアンスのストレージコントローラの公称温度または最大温度を超えました。

アプライアンスの温度センサーが取り外されました

温度センサーが取り外されました。

ディスク I/O が非常に遅い

ディスクI/Oが非常に遅い場合は、グリッドのパフォーマンスに影響する可能性があります。

ストレージアプライアンスのファンで障害が検出されました

アプライアンスのストレージコントローラのファンユニットで問題が検出されました。

ストレージアプライアンスストレージの接続がデグレードされました

コンピューティングコントローラとストレージコントローラの間の接続に問題があります。

ストレージデバイスにアクセスできません

ストレージデバイスにアクセスできません。

監査およびsyslogアラート

アラート名 説明

監査ログをメモリ内キューに追加しています

ノードからローカルsyslogサーバにログを送信できず、メモリ内キューがいっぱいになっています。

外部 syslog サーバの転送エラーです

ノードから外部syslogサーバにログを転送できません。

大規模な監査キュー

監査メッセージのディスクキューがいっぱいです。この状況に対処しないと、S3処理またはSwift処理が失敗する可能性があります。

ログをディスク上キューに追加しています

ノードから外部syslogサーバにログを転送できず、ディスクのキューがいっぱいになっています。

バケットアラート

アラート名 説明

FabricPool バケットにサポート対象外のバケット整合性設定があります

FabricPool バケットでは、available整合性レベルが使用されますが、このレベルはサポートされていません。

Cassandraアラート

アラート名 説明

Cassandra 自動コンパクターエラーです

Cassandra 自動コンパクターでエラーが発生しました。

Cassandra 自動コンパクターメトリックが古くなっています

Cassandra の自動圧縮機能を説明する指標が最新ではありません。

Cassandra 通信エラー

Cassandra サービスを実行するノード間の通信で問題が発生しています。

Cassandra の圧縮処理が過負荷です

Cassandra コンパクションプロセスが過負荷状態です。

Cassandraオーバーサイズ書き込みエラー

内部StorageGRID プロセスがCassandraに送信した書き込み要求が大きすぎます。

Cassandra 修復指標が最新ではありません

Cassandra 修復ジョブを説明する指標が最新ではありません。

Cassandra の修復の進捗が遅い

Cassandra データベースの修復の進捗状況が遅い。

Cassandra 修復サービスを使用できません

Cassandra 修復サービスは使用できません。

Cassandra テーブルが破損しています

Cassandra がテーブルの破損を検出しました。テーブルの破損が検出されると、 Cassandra が自動的に再起動します。

読み取り可用性の向上が無効になりました

読み取り可用性の向上を無効にすると、ストレージノードを使用できない場合にGET要求とHEAD要求が失敗することがあります。

クラウドストレージプールのアラート

アラート名 説明

クラウドストレージプールの接続エラー

クラウドストレージプールの健全性チェックで、新たなエラーが 1 つ以上検出されました。

グリッド間レプリケーションのアラート

アラート名 説明

クロスグリッドレプリケーションの永続的な障害

ユーザの介入を必要とするグリッド間レプリケーションエラーが発生しました。

グリッド間レプリケーションリソースを使用できません

リソースを使用できないため、グリッド間レプリケーション要求が保留になっています。

DHCPアラート

アラート名 説明

DHCP リースの期限が切れました

ネットワークインターフェイスの DHCP リースが期限切れです。

DHCP リースがまもなく期限切れになります

ネットワークインターフェイスの DHCP リースがまもなく期限切れになります。

DHCP サーバが使用できません

DHCP サーバが使用できない。

デバッグおよびトレースアラート

アラート名 説明

パフォーマンスへの影響をデバッグします

デバッグモードを有効にすると、システムパフォーマンスに悪影響を及ぼす可能性があります。

トレース設定が有効になりました

トレース構成を有効にすると、システムパフォーマンスに悪影響を及ぼす可能性があります。

EメールアラートとAutoSupport アラート

アラート名 説明

AutoSupport メッセージの送信に失敗しました

最新のAutoSupport メッセージの送信に失敗しました。

E メール通知のエラーです

アラートの E メール通知を送信できませんでした。

イレイジャーコーディング(EC)アラート

アラート名 説明

EC のリバランシングに失敗しました

ECリバランシング手順 が失敗したか、停止しました。

EC の修復エラー

ECデータの修復ジョブが失敗したか停止しました。

EC の修復が停止した

ECデータの修復ジョブが停止しました。

証明書の有効期限に関するアラート

アラート名 説明

クライアント証明書の有効期限

1つ以上のクライアント証明書の有効期限が近づいています。

S3およびSwiftのグローバルサーバ証明書の有効期限

S3およびSwiftのグローバルサーバ証明書の有効期限が近づいています。

ロードバランサエンドポイント証明書の有効期限

1 つ以上のロードバランサエンドポイント証明書の有効期限が近づいています。

管理インターフェイスのサーバ証明書の有効期限

管理インターフェイスで使用されるサーバ証明書の有効期限が近づいています。

外部 syslog CA 証明書の有効期限

外部 syslog サーバ証明書への署名に使用される認証局( CA )証明書の有効期限が近づいています。

外部 syslog クライアント証明書の有効期限

外部 syslog サーバのクライアント証明書の有効期限が近づいています。

外部 syslog サーバ証明書の有効期限

外部 syslog サーバから提供されるサーバ証明書の有効期限が近づいています。

グリッドネットワークのアラート

アラート名 説明

Grid ネットワーク MTU が一致しません

グリッドネットワークインターフェイス(eth0)のMTU設定は、グリッド内のノード間で大きく異なります。

グリッドフェデレーションアラート

アラート名 説明

グリッドフェデレーション証明書の有効期限

1つ以上のグリッドフェデレーション証明書の有効期限が近づいています。

グリッドフェデレーション接続に失敗しました

ローカルグリッドとリモートグリッドの間のグリッドフェデレーション接続が機能していません。

高使用率または高レイテンシのアラート

アラート名 説明

Java ヒープの使用率が高い

Java ヒープ領域の使用率が高くなっています。

メタデータクエリのレイテンシが高くなっています

Cassandra メタデータクエリの平均時間が長すぎます。

アイデンティティフェデレーションアラート

アラート名 説明

アイデンティティフェデレーションの同期に失敗する

アイデンティティソースからフェデレーテッドグループとフェデレーテッドユーザを同期できません。

テナントのアイデンティティフェデレーションの同期が失敗する

テナントで設定されたアイデンティティソースからフェデレーテッドグループとフェデレーテッドユーザを同期できない。

情報ライフサイクル管理(ILM)のアラート

アラート名 説明

ILM 配置を実現できません

ILMルールの配置手順を一部のオブジェクトで実行できません。

ILM のスキャン期間が長すぎます

ILMのスキャン、評価、およびオブジェクトへの適用にかかる時間が長すぎます。

ILM のスキャン速度が低下しています

ILM のスキャン速度は 100 オブジェクト / 秒未満に設定されます。

キー管理サーバ(KMS)のアラート

アラート名 説明

KMS CA 証明書の有効期限

キー管理サーバ( KMS )証明書への署名に使用する CA 証明書の有効期限が近づいています。

KMS クライアント証明書の有効期限

キー管理サーバのクライアント証明書の有効期限が近づいています

KMS の設定をロードできませんでした

キー管理サーバの設定は存在しますが、ロードできませんでした。

KMS 接続エラー

アプライアンスノードがサイトのキー管理サーバに接続できませんでした。

KMS 暗号化キー名が見つかりません

設定されているキー管理サーバに、指定した名前と一致する暗号化キーがありません。

KMS 暗号化キーのローテーションに失敗しました

アプライアンスのボリュームはすべて復号化されましたが、1つ以上のボリュームを最新のキーにローテーションできませんでした。

KMS は設定されていません

このサイトにはキー管理サーバがありません。

KMS キーでアプライアンスボリュームを復号化できませんでした

ノード暗号化が有効になっているアプライアンス上の 1 つ以上のボリュームを、現在の KMS キーで復号化できませんでした。

KMS サーバ証明書の有効期限

キー管理サーバ( KMS )で使用されるサーバ証明書の有効期限が近づいています。

ローカルクロックオフセットアラート

アラート名 説明

ローカル・クロック・ラージ・タイム・オフセット

ローカルクロックとネットワークタイムプロトコル(NTP)時間のオフセットが大きすぎます。

メモリ不足またはスペース不足のアラート

アラート名 説明

監査ログのディスク容量が不足しています

監査ログに使用できるスペースが少なくなっています。この状況に対処しないと、S3処理またはSwift処理が失敗する可能性があります。

利用可能なノードメモリが少なくなっています

ノードの使用可能な RAM の容量が少なくなっています。

ストレージプールの空き容量が不足しています

ストレージノードにオブジェクトデータを格納できるスペースが少なくなっています。

ノードメモリが不足しています

ノードに搭載されているメモリの容量が少なくなっています。

メタデータストレージが不足しています

オブジェクトメタデータを格納できるスペースが少なくなっています。

ディスク容量不足です

指標データベースに使用できるスペースが少なくなっています。

オブジェクトデータのストレージが少ない

オブジェクトデータを格納できるスペースが少なくなっています。

読み取り専用のローウォーターマークの上書き

Storage Volume Soft Read-Only Watermark の上書きが、ストレージノードに対して最適化された最小ウォーターマークを下回っています。

ルートディスク容量が不足しています

ルートディスクの使用可能なスペースが少なくなっています。

システムのデータ容量が不足しています

/var/localマウントポイントでStorageGRID システムデータに使用できるスペースが少なくなっています。

tmp ディレクトリの空きスペースが不足しています

/tmp ディレクトリのスペースが不足しています。

ノードまたはノードのネットワークアラート

アラート名 説明

ファイアウォールの設定に失敗しました

ファイアウォール設定を適用できませんでした。

ノードのネットワーク接続エラー

ノード間でデータを転送中にエラーが発生しました。

ノードネットワーク受信フレームエラー

ノードで受信したネットワークフレームの割合が高いとエラーが発生していました。

ノードが NTP サーバと同期されていません

ノードがネットワークタイムプロトコル(NTP)サーバと同期されていません。

NTP サーバでノードがロックされていません

ノードがネットワークタイムプロトコル( NTP )サーバにロックされていません。

非アプライアンスノードのネットワークが停止しています

1 つ以上のネットワークデバイスが停止しているか切断されています。

管理ネットワークでサービスアプライアンスのリンクが停止しています

アプライアンスの管理ネットワーク(eth1)へのインターフェイスが停止しているか切断されています。

管理ネットワークポート 1 のサービスアプライアンスリンクが停止しています

アプライアンスの管理ネットワークポート 1 が停止しているか切断されています。

クライアントネットワークでサービスアプライアンスのリンクが停止しています

アプライアンスのクライアントネットワーク(eth2)へのインターフェイスが停止しているか切断されています。

ネットワークポート1でサービスアプライアンスのリンクが停止しています

アプライアンスのネットワークポート1が停止しているか切断されています。

ネットワークポート2でサービスアプライアンスのリンクが停止しています

アプライアンスのネットワークポート2が停止しているか切断されています。

ネットワークポート3でサービスアプライアンスのリンクが停止しています

アプライアンスのネットワークポート3が停止しているか切断されています。

ネットワークポート4でサービスアプライアンスのリンクが停止しています

アプライアンスのネットワークポート4が停止しているか切断されています。

管理ネットワークでのストレージアプライアンスのリンクが停止しています

アプライアンスの管理ネットワーク(eth1)へのインターフェイスが停止しているか切断されています。

管理ネットワークポート 1 のストレージアプライアンスのリンクが停止しています

アプライアンスの管理ネットワークポート 1 が停止しているか切断されています。

クライアントネットワークでストレージアプライアンスのリンクが停止しています

アプライアンスのクライアントネットワーク(eth2)へのインターフェイスが停止しているか切断されています。

ネットワークポート1でストレージアプライアンスのリンクが停止しています

アプライアンスのネットワークポート1が停止しているか切断されています。

ネットワークポート2でストレージアプライアンスのリンクが停止しています

アプライアンスのネットワークポート2が停止しているか切断されています。

ネットワークポート3でストレージアプライアンスのリンクが停止しています

アプライアンスのネットワークポート3が停止しているか切断されています。

ネットワークポート4でストレージアプライアンスのリンクが停止しています

アプライアンスのネットワークポート4が停止しているか切断されています。

ストレージノードが目的のストレージ状態ではありません

内部エラーまたはボリューム関連の問題 が原因で、ストレージノード上のLDRサービスを目的の状態に移行できません

ノードと通信できません

1つ以上のサービスが応答していないか、ノードにアクセスできません。

予期しないノードのリブートです

過去 24 時間以内にノードが予期せずリブートされました。

オブジェクトアラート

アラート名 説明

オブジェクトの存在チェックに失敗しました

オブジェクトの存在チェックジョブが失敗しました。

オブジェクトの存在チェックが停止しました

オブジェクトの存在チェックジョブが停止しました。

オブジェクトが失われた

グリッドから 1 つ以上のオブジェクトが失われました。

S3 PUTオブジェクトサイズが大きすぎます

クライアントがS3のサイズ制限を超えるPUT Object処理を試行しています。

未識別の破損オブジェクトが検出されました

レプリケートオブジェクトストレージにファイルが見つかりましたが、レプリケートオブジェクトとして識別できませんでした。

プラットフォームサービスのアラート

アラート名 説明

プラットフォームサービスを利用できません

実行中または利用可能な状態の、 RSM サービスを搭載したストレージノードがサイトで不足しています。

ストレージボリュームのアラート

アラート名 説明

ストレージボリュームで対応が必要です

ストレージボリュームはオフラインで、対応が必要です。

ストレージボリュームをリストアする必要があります

ストレージボリュームがリカバリされたため、リストアが必要です。

ストレージボリュームはオフラインです

ストレージボリュームが5分以上オフラインになっています。ボリュームのフォーマット中にノードがリブートされた可能性があります。

ボリュームのリストアでレプリケートデータの修復を開始できませんでした

修復されたボリュームのレプリケートデータの修復を自動的に開始できませんでした。

StorageGRID サービスのアラート

アラート名 説明

バックアップ構成を使用するnginxサービス

nginxサービスの設定が無効です。以前の設定が使用されています。

バックアップ設定を使用するnginx-gwサービス

nginx-gwサービスの設定が無効です。以前の設定が使用されています。

バックアップ設定を使用したSSHサービス

SSHサービスの設定が無効です。以前の設定が使用されています。

テナントアラート

アラート名 説明

テナントクォータの使用率が高い

クォータスペースの使用率が高くなっています。通知の原因 が多すぎる可能性があるため、このルールはデフォルトで無効になっています。