Skip to main content
本製品の最新リリースがご利用いただけます。
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

アラート一覧

共同作成者

次の表に、デフォルトの StorageGRID アラートをすべて示します。必要に応じて、システムの管理方法に合わせてカスタムのアラートルールを作成できます。

一部のアラートで使用される指標については、よく使用されるPrometheus指標に関する情報を参照してください。

アラート名 概要 および推奨される対処方法

アプライアンスのバッテリの有効期間が終了し

アプライアンスのストレージコントローラのバッテリの有効期間が終了しました。

  1. バッテリを交換します。バッテリの取り外しと交換の手順は、アプライアンスの設置とメンテナンスの手順のストレージコントローラを交換するための手順 に含まれています。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスのバッテリに問題があります

アプライアンスのストレージコントローラのバッテリに障害が発生しました。

  1. バッテリを交換します。バッテリの取り外しと交換の手順は、アプライアンスの設置とメンテナンスの手順のストレージコントローラを交換するための手順 に含まれています。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスバッテリの学習容量が不足しています

アプライアンスのストレージコントローラのバッテリで学習容量が不足しています。

  1. バッテリを交換します。バッテリの取り外しと交換の手順は、アプライアンスの設置とメンテナンスの手順のストレージコントローラを交換するための手順 に含まれています。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスバッテリの有効期限が近づいています

アプライアンスのストレージコントローラのバッテリの有効期限が近づいています。

  1. すぐにバッテリを交換してください。バッテリの取り外しと交換の手順は、アプライアンスの設置とメンテナンスの手順のストレージコントローラを交換するための手順 に含まれています。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスのバッテリが取り外されました

アプライアンスのストレージコントローラのバッテリがありません。

  1. バッテリを取り付けます。バッテリの取り外しと交換の手順は、アプライアンスの設置とメンテナンスの手順のストレージコントローラを交換するための手順 に含まれています。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスのバッテリが高温になっています

アプライアンスのストレージコントローラのバッテリが過熱しています。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. ファンや HVAC の故障など、温度上昇の考えられる原因を調査する。

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスの BMC 通信エラー

ベースボード管理コントローラ( BMC )との通信が失われました。

  1. BMC が正常に動作していることを確認します。ノード*を選択し、アプライアンスノードのハードウェア*タブを選択します。Compute Controller BMC IP フィールドを探し、その IP を参照します。

  2. ノードをメンテナンスモードにしてから、アプライアンスの電源をオフにしてオンにし、 BMC の通信をリストアします。使用しているアプライアンスのインストールとメンテナンスの手順を参照してください。

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスキャッシュバックアップデバイスに障害が発生しました

永続的キャッシュバックアップデバイスで障害が発生しました。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. テクニカルサポートにお問い合わせください。

アプライアンスキャッシュバックアップデバイスに十分な容量がありません

キャッシュバックアップデバイスの容量が不足しています。テクニカルサポートにお問い合わせください。

アプライアンスのキャッシュ・バックアップ・デバイスの書き込み保護

キャッシュバックアップデバイスは書き込み保護されています。テクニカルサポートにお問い合わせください。

アプライアンスのキャッシュメモリサイズが一致しません

アプライアンスの2台のコントローラのキャッシュサイズが異なります。テクニカルサポートにお問い合わせください。

アプライアンスコンピューティングコントローラシャーシの温度が高すぎます

StorageGRID アプライアンスのコンピューティングコントローラの温度が公称のしきい値を超えました。

  1. ハードウェアコンポーネントの過熱状態を確認し、推奨される対処方法に従います。

    • SG100 、 SG1000 、または SG6000 を使用している場合は、 BMC を使用します。

    • SG5600 または SG5700 を使用している場合は、 SANtricity System Manager を使用します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスのコンピューティングコントローラの CPU 温度が高すぎます

StorageGRID アプライアンスのコンピューティングコントローラの CPU 温度が公称のしきい値を超えました。

  1. ハードウェアコンポーネントの過熱状態を確認し、推奨される対処方法に従います。

    • SG100 、 SG1000 、または SG6000 を使用している場合は、 BMC を使用します。

    • SG5600 または SG5700 を使用している場合は、 SANtricity System Manager を使用します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスのコンピューティングコントローラを確認する必要があります

StorageGRID アプライアンスのコンピューティングコントローラでハードウェア障害が検出されました。

  1. ハードウェアコンポーネントにエラーがないかどうかを確認し、推奨される対処方法に従います。

    • SG100 、 SG1000 、または SG6000 を使用している場合は、 BMC を使用します。

    • SG5600 または SG5700 を使用している場合は、 SANtricity System Manager を使用します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスコンピューティングコントローラの電源装置 A に問題があります

コンピューティングコントローラの電源装置 A に問題があります。このアラートは、電源装置に障害が発生したか、電源の供給に問題があることを示している可能性があります。

  1. ハードウェアコンポーネントにエラーがないかどうかを確認し、推奨される対処方法に従います。

    • SG100 、 SG1000 、または SG6000 を使用している場合は、 BMC を使用します。

    • SG5600 または SG5700 を使用している場合は、 SANtricity System Manager を使用します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスコンピューティングコントローラの電源装置 B に問題があります

コンピューティングコントローラの電源装置Bに問題があります。このアラートは、電源装置に障害が発生したか、電源の供給に問題があることを示している可能性があります。

  1. ハードウェアコンポーネントにエラーがないかどうかを確認し、推奨される対処方法に従います。

    • SG100 、 SG1000 、または SG6000 を使用している場合は、 BMC を使用します。

    • SG5600 または SG5700 を使用している場合は、 SANtricity System Manager を使用します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスコンピューティングハードウェアモニタのサービスが停止する

ストレージハードウェアのステータスを監視するサービスによってデータのレポートが停止されました。

  1. ベース OS の EOS-system-status サービスのステータスを確認する。

  2. サービスが停止またはエラー状態の場合は、サービスを再起動します。

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスのファイバ・チャネル障害が検出されました

アプライアンスのストレージコントローラとコンピューティングコントローラの間のFibre Channel接続に問題があります。

  1. ハードウェアコンポーネントにエラーがないかどうかを確認します(* Nodes >*_appliance node_name > Hardware *)。いずれかのコンポーネントのステータスが「公称」でない場合は、次のアクションを実行します。

    1. コントローラ間の Fibre Channel ケーブルが完全に接続されていることを確認します。

    2. ファイバチャネルケーブルが過度に曲がっていないことを確認します。

    3. SFP+ モジュールが正しく装着されていることを確認します。

      • 注: * この問題が解決しない場合、 StorageGRID システムは問題のある接続を自動的にオフラインにすることがあります。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスのインストールとメンテナンスの手順を参照してください。

アプライアンスのファイバ・チャネル HBA ポート障害

ファイバチャネルHBAポートで障害が発生しているか、障害が発生しています。テクニカルサポートにお問い合わせください。

アプライアンスのフラッシュキャッシュドライブが最適な状態でありません

SSD キャッシュに使用されているドライブが最適な状態でありません。

  1. SSD キャッシュドライブを交換します。アプライアンスの設置とメンテナンスの手順を参照してください。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスインターコネクト / バッテリキャニスターが取り外されました

インターコネクト / バッテリキャニスターがありません。

  1. バッテリを交換します。バッテリの取り外しと交換の手順は、アプライアンスの設置とメンテナンスの手順のストレージコントローラを交換するための手順 に含まれています。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスの LACP ポートがありません

StorageGRID アプライアンスのポートが LACP ボンドに参加していません。

  1. スイッチの設定を確認します。インターフェイスが正しいリンクアグリゲーショングループに設定されていることを確認してください。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンス全体の電源装置がデグレード状態になりました

StorageGRID アプライアンスの電源が、推奨される動作電圧から逸脱しています。

  1. 電源装置 A と B のステータスを調べ、どちらの電源装置に異常があるかを確認し、推奨される対処方法に従います。

    • SG100 、 SG1000 、または SG6000 を使用している場合は、 BMC を使用します。

    • SG5600 または SG5700 を使用している場合は、 SANtricity System Manager を使用します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージコントローラ A の障害

StorageGRID アプライアンスのストレージコントローラ A で障害が発生した。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージコントローラ B の障害

StorageGRID アプライアンスのストレージコントローラ B で障害が発生した。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージコントローラのドライブ障害

StorageGRID アプライアンスの 1 つ以上のドライブで障害が発生しているか、または最適な状態でありません。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージコントローラハードウェア問題

SANtricity ソフトウェアから、 StorageGRID アプライアンスのコンポーネントについて「 Needs Attention 」が報告されます。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージコントローラの電源装置 A に障害が発生しました

StorageGRID アプライアンスの電源装置 A が、推奨される動作電圧から逸脱しています。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージコントローラの電源装置 B に障害が発生しました

StorageGRID アプライアンスの電源装置 B が、推奨される動作電圧から逸脱しています。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスストレージハードウェアモニタのサービスが停止する

ストレージハードウェアのステータスを監視するサービスによってデータのレポートが停止されました。

  1. ベース OS の EOS-system-status サービスのステータスを確認する。

  2. サービスが停止またはエラー状態の場合は、サービスを再起動します。

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスストレージシェルフがデグレード状態になります

ストレージアプライアンスのストレージシェルフのいずれかのコンポーネントのステータスがデグレードになっています。

  1. SANtricity System Manager を使用してハードウェアコンポーネントを確認し、推奨される対処方法に従います。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

アプライアンスの温度が超過しました

アプライアンスのストレージコントローラの公称温度または最大温度を超えました。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. ファンや HVAC の故障など、温度上昇の考えられる原因を調査する。

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

アプライアンスの温度センサーが取り外されました

温度センサーが取り外されました。テクニカルサポートにお問い合わせください。

Cassandra 自動コンパクターエラーです

Cassandraの自動compactorでエラーが発生しました。Cassandraの自動compactorはすべてのストレージノードに存在し、オーバーライトおよび大量のワークロードを削除するためにCassandraデータベースのサイズを管理します。この状態が解消されない間は、特定のワークロードでメタデータの消費量が予期せずに増加します。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. テクニカルサポートにお問い合わせください。

Cassandra 自動コンパクターメトリックが古くなっています

Cassandra の自動圧縮機能を説明する指標が最新ではありません。Cassandra の自動圧縮機能はすべてのストレージノードに存在し、オーバーライトや大量のワークロードの削除用に Cassandra データベースのサイズを管理します。このアラートが解決しない間、特定のワークロードでメタデータの使用量が予期せずに増加します。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. テクニカルサポートにお問い合わせください。

Cassandra 通信エラー

Cassandraサービスを実行するノード間の通信で問題が発生しています。このアラートは、ノード間の通信に干渉していることを示しています。1 つ以上のストレージノードでネットワーク問題 または Cassandra サービスが停止している可能性があります。

  1. 1 つ以上のストレージノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. 1 つ以上のストレージノードに影響している可能性のあるネットワーク問題 がないかどうかを確認します。

  3. Support > Tools > Grid Topology *を選択します。

  4. システム内のストレージノードごとに、 * SSM * > * Services * を選択します。Cassandraサービスのステータスが「running」であることを確認します。

  5. Cassandraが実行されていない場合は、リカバリとメンテナンスの手順のサービスを開始または再開する手順に従います。

  6. Cassandra サービスのすべてのインスタンスが実行中でアラートが解決されない場合は、テクニカルサポートに連絡してください。

""

Cassandra の圧縮処理が過負荷です

Cassandraのコンパクションプロセスが過負荷状態です。コンパクションプロセスが過負荷の場合、読み取りパフォーマンスが低下し、RAMが使用される可能性があります。Cassandra サービスが応答しなくなったり、クラッシュしたりする可能性もあります。

  1. リカバリとメンテナンスの手順のサービスを再起動する手順に従って、Cassandraサービスを再起動します。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

""

Cassandra 修復指標が最新ではありません

Cassandra 修復ジョブを説明する指標が最新ではありません。この状況が 48 時間以上続く場合は、バケットのリストなどのクライアントクエリで削除されたデータが表示されることがあります。

  1. ノードをリブートします。Grid Managerから* Nodes *に移動し、ノードを選択してTasksタブを選択します。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

Cassandra の修復の進捗が遅い

Cassandraデータベースの修復の進捗状況が低速化しています。データベースの修復が低速化すると、Cassandraのデータ整合性処理が中断されます。この状況が 48 時間以上続く場合は、バケットのリストなどのクライアントクエリで削除されたデータが表示されることがあります。

  1. すべてのストレージノードがオンラインで、ネットワーク関連のアラートがないことを確認します。

  2. このアラートを最大 2 日間監視して、問題 が自動的に解決するかどうかを確認します。

  3. データベースの修復に時間がかかる場合は、テクニカルサポートに連絡してください。

Cassandra 修復サービスを使用できません

Cassandra修復サービスは使用できません。Cassandra修復サービスはすべてのストレージノードに存在し、Cassandraデータベースに重要な修復機能を提供します。この状況が 48 時間以上続く場合は、バケットのリストなどのクライアントクエリで削除されたデータが表示されることがあります。

  1. Support > Tools > Grid Topology *を選択します。

  2. システム内のストレージノードごとに、 * SSM * > * Services * を選択します。Cassandra Reaper サービスのステータスが「 Running 」であることを確認します。

  3. Cassandra Reaperが実行されていない場合は、リカバリとメンテナンスの手順のサービスを開始または再起動する手順に従います。

  4. Cassandra Reaper サービスのすべてのインスタンスが実行中で、アラートが解決されない場合は、テクニカルサポートにお問い合わせください。

""

クラウドストレージプールの接続エラー

クラウドストレージプールの健全性チェックで、新たなエラーが 1 つ以上検出されました。

  1. ストレージプールページのクラウドストレージプールセクションに移動します。

  2. Last Error 列を確認して、エラーが発生しているクラウドストレージプールを特定します。

  3. 情報ライフサイクル管理を使用してオブジェクトを管理する手順を参照してください。

DHCP リースの期限が切れました

ネットワークインターフェイスのDHCPリースが期限切れです。DHCPリースの期限が切れている場合は、推奨される対処方法に従います。

  1. このノードと該当するインターフェイス上の DHCP サーバが接続されていることを確認してください。

  2. DHCP サーバの影響を受けるサブネットで割り当てることができる IP アドレスがあることを確認します。

  3. DHCP サーバで設定されている IP アドレスが永続的に予約されていることを確認します。または、 StorageGRID IP 変更ツールを使用して、 DHCP アドレスプールの外部に静的 IP アドレスを割り当てます。リカバリとメンテナンスの手順を参照してください。

""

DHCP リースがまもなく期限切れになります

ネットワークインターフェイスのDHCPリースがまもなく期限切れになります。DHCPリースが期限切れにならないようにするには、推奨される対処方法に従います。

  1. このノードと該当するインターフェイス上の DHCP サーバが接続されていることを確認してください。

  2. DHCP サーバの影響を受けるサブネットで割り当てることができる IP アドレスがあることを確認します。

  3. DHCP サーバで設定されている IP アドレスが永続的に予約されていることを確認します。または、 StorageGRID IP 変更ツールを使用して、 DHCP アドレスプールの外部に静的 IP アドレスを割り当てます。リカバリとメンテナンスの手順を参照してください。

""

DHCP サーバが使用できません

DHCPサーバが使用できません。StorageGRID ノードがDHCPサーバに接続できません。ノードの IP アドレスの DHCP リースを検証できません。

  1. このノードと該当するインターフェイス上の DHCP サーバが接続されていることを確認してください。

  2. DHCP サーバの影響を受けるサブネットで割り当てることができる IP アドレスがあることを確認します。

  3. DHCP サーバで設定されている IP アドレスが永続的に予約されていることを確認します。または、 StorageGRID IP 変更ツールを使用して、 DHCP アドレスプールの外部に静的 IP アドレスを割り当てます。リカバリとメンテナンスの手順を参照してください。

""

ディスク I/O が非常に遅い

ディスク I/O が非常に遅いと、 StorageGRID のパフォーマンスに影響している可能性があります。

  1. 問題 がストレージアプライアンスノードに関連している場合は、 SANtricity システムマネージャを使用して、障害が発生しているドライブ、予測される障害が発生しているドライブ、または進行中のドライブの修復を確認します。また、アプライアンスのコンピューティングコントローラとストレージコントローラ間のファイバチャネルまたは SAS リンクのステータスを調べて、リンクが停止しているか、エラー率が高いリンクが表示されていないかを確認します。

  2. このノードのボリュームをホストしているストレージシステムを調べて、低速な I/O のルート原因 を特定して修正します

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

メモ 影響を受けるノードでは、グリッドの全体的なパフォーマンスへの影響を回避するために、サービスが無効になって、ノード自体原因となった状態が解消されて通常の I/O パフォーマンスが検出された場合は、フルサービスに自動的に戻ります。

E メール通知のエラーです

アラートのEメール通知を送信できませんでした。このアラートは、アラートEメール通知が失敗した場合、またはテストEメール(* Alerts > Email Setup *ページから送信)を配信できない場合にトリガーされます。

  1. アラートの「 * Site/Node * 」列に表示されている管理ノードから Grid Manager にサインインします。

  2. [アラート>*電子メール設定*]ページに移動し、設定を確認して、必要に応じて変更します。

  3. [ テストメールの送信 ] をクリックし、テスト受信者の電子メールの受信ボックスを確認します。テスト用 E メールを送信できない場合は、このアラートの新しいインスタンスがトリガーされることがあります。

  4. テスト用 E メールを送信できなかった場合は、 E メールサーバがオンラインであることを確認します。

  5. サーバが動作している場合は、* Support > Tools > Logs *を選択し、管理ノードのログを収集します。アラートの前後 15 分の期間を指定します。

  6. ダウンロードしたアーカイブを展開し、の内容を確認します prometheus.log (_/GID<gid><time_stamp>/<site_node>/<time_stamp>/metrics/prometheus.log)

  7. 問題を解決できない場合は、テクニカルサポートにお問い合わせください。

クライアント証明書ページで設定された証明書の有効期限

[クライアント証明書]ページで設定されている1つ以上の証明書の有効期限が近づいています。

  1. [* Configuration > Access Control > Client Certificates *]を選択します。

  2. 有効期限が近い証明書を選択してください。

  3. 「* Edit *」を選択して、新しい証明書をアップロードまたは生成します。

  4. 有効期限が近い証明書ごとに、上記の手順を繰り返します。

ロードバランサエンドポイント証明書の有効期限

1 つ以上のロードバランサエンドポイント証明書の有効期限が近づいています。

  1. [* Configuration > Network Settings > Load Balancer Endpoints *]を選択します。

  2. まもなく期限切れになる証明書を含むエンドポイントを選択してください。

  3. 「 * エンドポイントの編集」を選択して、新しい証明書をアップロードまたは生成します。

  4. 証明書の有効期限が切れているエンドポイントまたはまもなく期限切れになるエンドポイントごとに、上記の手順を繰り返します。

ロードバランサエンドポイントの管理の詳細については、StorageGRID の管理手順を参照してください。

管理インターフェイス用のサーバ証明書の有効期限

管理インターフェイスで使用されるサーバ証明書の有効期限が近づいています。

  1. [* Configuration ]>[ Network Settings ]>[ Server Certificates*]を選択します。

  2. 管理インターフェイスのサーバ証明書セクションで、新しい証明書をアップロードします。

ストレージAPIエンドポイント用のサーバ証明書の有効期限

ストレージ API エンドポイントへのアクセスに使用されるサーバ証明書の有効期限が近づいています。

  1. [* Configuration ]>[ Network Settings ]>[ Server Certificates*]を選択します。

  2. Object Storage API Service EndpointsのServer Certificateセクションで、新しい証明書をアップロードします。

Grid ネットワーク MTU が一致しません

グリッドネットワークインターフェイス(eth0)の最大伝送ユニット(MTU)設定は、グリッド内のノード間で大きく異なります。MTU設定の違いによって、eth0ネットワークの一部がジャンボフレーム用に設定されていることがわかります。MTU サイズが 1000 を超えると、原因 のネットワークパフォーマンスの問題が発生する可能性があります。

Java ヒープの使用率が高い

Javaヒープスペースの使用率が高くなっています。Javaヒープがいっぱいになると、メタデータサービスが使用できなくなり、クライアント要求が失敗することがあります。

  1. ダッシュボードで ILM アクティビティを確認します。このアラートは、 ILM ワークロードが減少すると自動的に解決する場合があります。

  2. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  3. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

メタデータクエリのレイテンシが高くなっています

Cassandraメタデータクエリの平均時間が長すぎます。ディスクの交換などのハードウェアの変更や、取り込みの急増などのワークロードの変化が原因で、クエリのレイテンシが増加する可能性があります。

  1. クエリのレイテンシが増大した時間帯にハードウェアやワークロードの変化がなかったかを確認します。

  2. 問題を解決できない場合は、テクニカルサポートにお問い合わせください。

アイデンティティフェデレーションの同期に失敗する

アイデンティティソースからフェデレーテッドグループとフェデレーテッドユーザを同期できません。

  1. 設定した LDAP サーバがオンラインで使用可能であることを確認します。

  2. アイデンティティフェデレーションページの設定を確認します。すべての値が最新であることを確認します。StorageGRID の管理手順の「フェデレーテッドアイデンティティソースの設定」を参照してください。

  3. [ * 接続のテスト * ] をクリックして、 LDAP サーバーの設定を確認します。

  4. 問題 を解決できない場合は、テクニカルサポートにお問い合わせください。

ILM 配置を実現できません

特定のオブジェクトに対するILMルールの配置手順を実行できません。このアラートは、配置手順に必要なノードが使用できないか、ILMルールの設定が正しくないことを示しています。たとえば、レプリケートコピーをストレージノードよりも多く指定するルールがあるとします。

  1. すべてのノードがオンラインであることを確認してください。

  2. すべてのノードがオンラインの場合は、アクティブな ILM ポリシーを使用しているすべての ILM ルールの配置手順を確認します。すべてのオブジェクトに対して有効な手順があることを確認します。情報ライフサイクル管理を使用してオブジェクトを管理する手順を参照してください。

  3. 必要に応じて、ルールの設定を更新し、新しいポリシーをアクティブ化します。

    メモ アラートがクリアされるまでに1日程度かかる場合があります。
  4. 問題が解決しない場合は、テクニカルサポートにお問い合わせください。

メモ このアラートはアップグレード中に表示され、アップグレードが正常に完了してから1日間は存続する場合があります。アップグレードによってこのアラートがトリガーされると、アラートは自動的にクリアされます。

ILM のスキャン期間が長すぎます

オブジェクトのスキャン、評価、およびILMの適用に必要な時間が長すぎます。ILMによるすべてのオブジェクトのフルスキャンが完了するまでの推定時間が長すぎると(ダッシュボードの* Scan Period - Estimated *を参照)、アクティブなILMポリシーが新たに取り込まれたオブジェクトに適用されない可能性があります。ILM ポリシーへの変更が既存のオブジェクトに適用されない場合があります。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. すべてのストレージノードがオンラインであることを確認します。

  3. クライアントトラフィックの量を一時的に減らします。たとえば、グリッドマネージャから、Configuration>*Network Settings*>*Traffic Classification*を選択し、帯域幅または要求数を制限するポリシーを作成します。

  4. ディスク I/O または CPU が過負荷状態の場合は、負荷を減らすか、リソースを増やしてください。

  5. 必要に応じて、同期配置を使用するように ILM ルールを更新します( StorageGRID 11.3 以降に作成されたルールのデフォルト)。

  6. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

ILM のスキャン速度が低下しています

ILMのスキャン速度が100オブジェクト/秒未満に設定されています。このアラートは、システムのILMスキャン速度が1秒あたり100オブジェクト未満に変更されたことを示しています(デフォルト:400オブジェクト/秒)。新しく取り込まれたオブジェクトにはアクティブな ILM ポリシーが適用されない場合があります。以降に ILM ポリシーに対して行われた変更は、既存のオブジェクトには適用されません。

  1. 継続的なサポート調査の一環として ILM スキャン率に一時的に変更が加えられたかどうかを確認します。

  2. テクニカルサポートにお問い合わせください。

重要 テクニカルサポートに連絡しなくても ILM のスキャン速度を変更しないでください。

KMS CA 証明書の有効期限

キー管理サーバ( KMS )証明書への署名に使用する CA 証明書の有効期限が近づいています。

  1. KMS ソフトウェアを使用して、キー管理サーバの CA 証明書を更新します。

  2. Grid Managerから、* Configuration > System Settings > Key Management Server *の順に選択します。

  3. 証明書ステータスの警告がある KMS を選択します。

  4. 「 * 編集 * 」を選択します。

  5. 「 * 次へ * 」を選択して、手順 2 (サーバー証明書のアップロード)に進みます。

  6. 新しい証明書をアップロードするには、 * Browse * を選択します。

  7. [ 保存( Save ) ] を選択します。

KMS クライアント証明書の有効期限

キー管理サーバのクライアント証明書の有効期限が近づいています。

  1. Grid Managerから、* Configuration > System Settings > Key Management Server *の順に選択します。

  2. 証明書ステータスの警告がある KMS を選択します。

  3. 「 * 編集 * 」を選択します。

  4. 「 * 次へ * 」を選択して、手順 3 (クライアント証明書のアップロード)に進みます。

  5. 新しい証明書をアップロードするには、 * Browse * を選択します。

  6. 新しい秘密鍵をアップロードするには、 * Browse * を選択します。

  7. [ 保存( Save ) ] を選択します。

KMS の設定をロードできませんでした

キー管理サーバの設定は存在しますが、ロードできませんでした。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

KMS 接続エラー

アプライアンスノードがサイトのキー管理サーバに接続できませんでした。

  1. Grid Managerから、* Configuration > System Settings > Key Management Server *の順に選択します。

  2. ポートおよびホスト名のエントリが正しいことを確認します。

  3. サーバ証明書、クライアント証明書、およびクライアント証明書の秘密鍵が正しいかどうか、および有効期限が切れていないかどうかを確認します。

  4. ファイアウォールの設定により、アプライアンスノードが指定された KMS と通信できることを確認してください。

  5. ネットワークまたは DNS の問題を修正します。

  6. サポートが必要な場合やアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

KMS 暗号化キー名が見つかりません

設定されているキー管理サーバに、指定した名前と一致する暗号化キーがありません。

  1. サイトに割り当てられている KMS が、暗号化キーと以前のバージョンに対応する正しい名前を使用していることを確認します。

  2. サポートが必要な場合やアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

KMS 暗号化キーのローテーションに失敗しました

アプライアンスのすべてのボリュームが復号化されましたが、 1 つ以上のボリュームを最新のキーにローテーションできませんでした。テクニカルサポートにお問い合わせください。

KMS は設定されていません

このサイトにはキー管理サーバがありません。

  1. Grid Managerから、* Configuration > System Settings > Key Management Server *の順に選択します。

  2. このサイトに KMS を追加するか、デフォルトの KMS を追加します。

KMS キーでアプライアンスボリュームを復号化できませんでした

ノード暗号化が有効になっているアプライアンス上の 1 つ以上のボリュームを、現在の KMS キーで復号化できませんでした。

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. キー管理サーバ( KMS )に設定されている暗号化キーと以前のバージョンのキーがあることを確認します。

  3. サポートが必要な場合やアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

KMS サーバ証明書の有効期限

キー管理サーバ( KMS )で使用されるサーバ証明書の有効期限が近づいています。

  1. KMS ソフトウェアを使用して、キー管理サーバのサーバ証明書を更新します。

  2. サポートが必要な場合やアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

大規模な監査キュー

監査メッセージのディスクキューがいっぱいです。

  1. システムの負荷を確認します — 大量のトランザクションが発生した場合は ' 時間が経過するとアラートは自動的に解決され ' このアラートは無視してかまいません

  2. アラートが解除されず重大度が上がった場合は、キューサイズのグラフを確認します。数時間から数日にわたって数値が増え続けている場合は、監査の負荷がシステムの監査キャパシティを超えている可能性があります。

  3. クライアントの書き込みとクライアントの読み取りの監査レベルをErrorまたはOff(* Configuration > Monitoring > Audit *)に変更することで、クライアントの処理速度を下げるか、ログに記録される監査メッセージの数を減らします。

監査ログのディスク容量が不足しています

監査ログに使用できるスペースが少なくなっています。

  1. このアラートを監視して、問題 が自動的に解決し、ディスクスペースが再び使用可能になるかどうかを確認します。

  2. 使用可能なスペースが減少し続ける場合は、テクニカルサポートにお問い合わせください。

利用可能なノードメモリが少なくなっています

ノードの使用可能なRAMの容量が少なくなっています。使用可能なRAMが少ない場合は、ワークロードに変化があるか、1つ以上のノードでメモリリークが発生している可能性があります。

  1. このアラートを監視して、問題 が自動的に解決するかどうかを確認します。

  2. 使用可能なメモリが Major アラートのしきい値を下回った場合は、テクニカルサポートに連絡してください。

ストレージプールの空き容量が不足しています

オブジェクトデータをストレージプールに格納できるスペースが少なくなっています。

  1. ILM > Storage Pools *を選択します。

  2. アラートに表示されたストレージプールを選択し、 * 詳細の表示 * を選択します。

  3. 追加のストレージ容量が必要かどうかを判断ストレージプール内の各サイトにストレージノードを追加するか、 1 つ以上の既存のストレージノードにストレージボリューム( LUN )を追加できます。

  4. 拡張手順 を実行してストレージ容量を増やします。

ノードメモリが不足しています

ノードに搭載されているメモリの量が少なくなっています。仮想マシンまたはLinuxホストで使用できるRAMの容量を増やしてください。Major アラートのしきい値を確認して、 StorageGRID ノードのデフォルトの最小要件を決定します。使用しているプラットフォームに対応したインストール手順を参照してください。

メタデータストレージが不足しています

オブジェクトメタデータを格納できるスペースが少なくなっています。* Criticalアラート*

  1. オブジェクトの取り込みを停止します。

  2. 拡張手順 にただちにストレージノードを追加します。

    • 主要アラート *

拡張手順 にただちにストレージノードを追加します。

  • Minor アラート *

    1. オブジェクトメタデータスペースの使用率を監視します。ノード*>*ストレージノード*>*ストレージ*を選択し、使用済みストレージオブジェクトメタデータのグラフを表示します。

    2. 拡張手順 にできるだけ早くストレージノードを追加します。

新しいストレージノードが追加されると、すべてのストレージノード間でオブジェクトメタデータが自動的にリバランシングされ、アラームが解除されます。

ディスク容量不足です

指標データベースに使用できるスペースが少なくなっています。

  1. このアラートを監視して、問題 が自動的に解決し、ディスクスペースが再び使用可能になるかどうかを確認します。

  2. 使用可能なスペースが減少し続ける場合は、テクニカルサポートにお問い合わせください。

オブジェクトデータのストレージが少ない

オブジェクトデータを格納できるスペースが少なくなっています。拡張手順 を実行してください。既存のストレージノードにストレージボリューム( LUN )を追加するか、または新しいストレージノードを追加することができます。

ルートディスク容量が不足しています

ルートディスクに使用できるスペースが少なくなっています。

  1. このアラートを監視して、問題 が自動的に解決し、ディスクスペースが再び使用可能になるかどうかを確認します。

  2. 使用可能なスペースが減少し続ける場合は、テクニカルサポートにお問い合わせください。

システムのデータ容量が不足しています

ローカルファイルシステム/var/local上のStorageGRID システムデータに使用できるスペースが少なくなっています。

  1. このアラートを監視して、問題 が自動的に解決し、ディスクスペースが再び使用可能になるかどうかを確認します。

  2. 使用可能なスペースが減少し続ける場合は、テクニカルサポートにお問い合わせください。

ノードのネットワーク接続エラー

nodes.Network間でのデータ転送中にエラーが発生した場合、手動操作なしに接続エラーがクリアされることがあります。エラーが解消されない場合は、テクニカルサポートにお問い合わせください。

ノードネットワーク受信フレームエラー

ノードで受信したネットワークフレームの割合が高いとエラーが発生しました。このアラートは、ケーブル不良やイーサネット接続のいずれかの端のトランシーバ不良など、ハードウェア問題 であることを示している可能性があります。

  1. アプライアンスを使用している場合は、 SFP+ または SFP28 トランシーバとケーブルを 1 本ずつ交換し、アラートが解除されるかどうかを確認します。

  2. このアラートが解決しない場合は、テクニカルサポートにお問い合わせください。

ノードが NTP サーバと同期されていません

ノードの時刻がネットワークタイムプロトコル( NTP )サーバと同期されていません。

  1. Stratum 3 以上の外部 NTP サーバが 4 つ以上指定されていることを確認します。

  2. すべての NTP サーバが正常に動作していることを確認します。

  3. NTP サーバへの接続を確認します。ファイアウォールによってブロックされていないことを確認してください。

NTP サーバでノードがロックされていません

ノードがネットワークタイムプロトコル( NTP )サーバにロックされていません。

  1. Stratum 3 以上の外部 NTP サーバが 4 つ以上指定されていることを確認します。

  2. すべての NTP サーバが正常に動作していることを確認します。

  3. NTP サーバへの接続を確認します。ファイアウォールによってブロックされていないことを確認してください。

非アプライアンスノードネットワークが停止しています

1 つ以上のネットワークデバイスが停止しているか切断されています。仮想マシンまたは Linux ホストにインストールされているノードのネットワークインターフェイス( eth )にアクセスできないことを示すアラートが表示されます。

テクニカルサポートにお問い合わせください。

オブジェクトが失われた

グリッドから1つ以上のオブジェクトが失われています。このアラートは、データが永続的に失われて読み出しできなくなったことを示している可能性があります。

  1. このアラートはすぐに調査してください。これ以上のデータ損失を防ぐための対処が必要になる場合があります。迅速に対処すれば、損失オブジェクトをリストアできる場合もあります。

  2. 原因となっている問題を解決したら、カウンタをリセットします。

    1. Support > Tools > Grid Topology *を選択します。

    2. アラートを生成したストレージノードに対して、 * _site _ * > * _grid node_name * > * LDR * > * Data Store * > * Configuration * > * Main * の順に選択します。

    3. [ * Lost Objects Count * ] を選択し、 [ * Apply Changes * ] をクリックします。

プラットフォームサービスを利用できません

RSMサービスを搭載したストレージノードが少なすぎて、サイトで稼働中または使用可能です。該当するサイトでRSMサービスを搭載したストレージノードの大部分がエラーのない状態で稼働していることを確認してください。

StorageGRID の管理手順の「プラットフォームサービスのトラブルシューティング」を参照してください。

管理ネットワークポート 1 のサービスアプライアンスリンクが停止しています

アプライアンスの管理ネットワークポート 1 が停止しているか切断されています。

  1. 管理ネットワークポート 1 に接続されているケーブルと物理的な接続を確認します。

  2. 接続の問題に対処します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

  3. このポートが目的で切断されている場合は、このルールを無効にします。Grid Managerから* Alerts > Alert Rules を選択し、ルールを選択して Edit rule をクリックします。次に、 [*enabled] チェックボックスをオフにします。

管理ネットワーク(またはクライアントネットワーク)上のサービスアプライアンスのリンクがダウン

管理ネットワーク( eth1 )またはクライアントネットワーク( eth2 )へのアプライアンスインターフェイスが停止しているか切断されている。

  1. StorageGRID ネットワークへのケーブル、 SFP 、および物理接続を確認します。

  2. 接続の問題に対処します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

  3. このポートが目的で切断されている場合は、このルールを無効にします。Grid Managerから* Alerts > Alert Rules を選択し、ルールを選択して Edit rule をクリックします。次に、 [*enabled] チェックボックスをオフにします。

サービスアプライアンスは、ネットワークポート 1 、 2 、 3 、または 4 でリンクダウンします

アプライアンスのネットワークポート 1 、 2 、 3 、または 4 が停止しているか、切断されています。

  1. StorageGRID ネットワークへのケーブル、 SFP 、および物理接続を確認します。

  2. 接続の問題に対処します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

  3. このポートが目的で切断されている場合は、このルールを無効にします。Grid Managerから* Alerts > Alert Rules を選択し、ルールを選択して Edit rule をクリックします。次に、 [*enabled] チェックボックスをオフにします。

サービスアプライアンスストレージの接続がデグレードされました

サービスアプライアンス内の2つのSSDのうちの1つで障害が発生したか、もう一方と同期が外れています。アプライアンスの機能には影響はありませんが、問題 にはすぐに対処する必要があります。両方のドライブに障害が発生すると、アプライアンスは動作しなくなります。

  1. Grid Managerから、* Nodes *>*_services applie__を選択し、 Hardware *タブを選択します。

  2. Storage RAID Mode * フィールドでメッセージを確認します。

  3. メッセージに再同期処理の進捗が表示された場合は、処理が完了するのを待ってから、アラートが解決したことを確認します。再同期メッセージは、 SSD が最近交換されたこと、または別の理由で再同期中であることを示します。

  4. いずれかの SSD で障害が発生したことを示すメッセージが表示された場合は、障害が発生したドライブをできるだけ早く交換します。

    サービスアプライアンスのドライブを交換する方法については、 SG100 および SG1000 アプライアンスのインストールおよびメンテナンスガイドを参照してください。

管理ネットワークポート 1 のストレージアプライアンスのリンクが停止しています

アプライアンスの管理ネットワークポート 1 が停止しているか切断されています。

  1. 管理ネットワークポート 1 に接続されているケーブルと物理的な接続を確認します。

  2. 接続の問題に対処します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

  3. このポートが目的で切断されている場合は、このルールを無効にします。Grid Managerから* Alerts > Alert Rules を選択し、ルールを選択して Edit rule をクリックします。次に、 [*enabled] チェックボックスをオフにします。

管理ネットワーク(またはクライアントネットワーク)でのストレージアプライアンスのリンクが停止

管理ネットワーク( eth1 )またはクライアントネットワーク( eth2 )へのアプライアンスインターフェイスが停止しているか切断されている。

  1. StorageGRID ネットワークへのケーブル、 SFP 、および物理接続を確認します。

  2. 接続の問題に対処します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

  3. このポートが目的で切断されている場合は、このルールを無効にします。Grid Managerから* Alerts > Alert Rules を選択し、ルールを選択して Edit rule をクリックします。次に、 [*enabled] チェックボックスをオフにします。

ネットワークポート 1 、 2 、 3 、または 4 でストレージアプライアンスのリンクが停止しています

アプライアンスのネットワークポート 1 、 2 、 3 、または 4 が停止しているか、切断されています。

  1. StorageGRID ネットワークへのケーブル、 SFP 、および物理接続を確認します。

  2. 接続の問題に対処します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

  3. このポートが目的で切断されている場合は、このルールを無効にします。Grid Managerから* Alerts > Alert Rules を選択し、ルールを選択して Edit rule をクリックします。次に、 [*enabled] チェックボックスをオフにします。

ストレージアプライアンスストレージの接続がデグレードされました

コンピューティングコントローラとストレージコントローラの間の接続に問題があります。

  1. アプライアンスに移動して、ポートのインジケータライトを確認します。

  2. ポートの LED が消灯している場合は、ケーブルが正しく接続されていることを確認します。必要に応じて、ケーブルを交換します。

  3. 最大 5 分待ちます。

    メモ 2本目のケーブルを交換する必要がある場合は、5分以上プラグを取り外さないでください。そうしないと、ルートボリュームが読み取り専用になり、ハードウェアの再起動が必要になることがあります。
  4. Grid Managerから* Nodes *を選択します。次に、問題があるノードの Hardware タブを選択します。アラート状態が解決したことを確認します。

ストレージデバイスにアクセスできません

ストレージデバイスにアクセスできません。このアラートは、基盤となるストレージデバイスの問題が原因でボリュームをマウントまたはアクセスできないことを示します。

  1. ノードに使用されているすべてのストレージデバイスのステータスを確認します。

  2. 必要に応じて、コンポーネントを交換します。使用しているアプライアンスハードウェアの設置とメンテナンスの手順を参照してください。

テナントクォータの使用率が高い

テナントクォータスペースの使用率が高くなっています。テナントのクォータを超えると、新しい取り込みは拒否されます。

メモ 多数の通知が生成される可能性があるため、このアラートルールはデフォルトで無効になっています。
  1. Grid Managerから* tenants *を選択します。

  2. テーブルを * クォータ使用率 * でソートします。

  3. クォータ使用率が 100% に近いテナントを選択します。

  4. 次のいずれか、または両方を実行します。

    • 「 * Edit * 」を選択して、テナントのストレージ・クォータを増やします。

    • クォータ使用率が高いことをテナントに通知します。

ノードと通信できません

1つ以上のサービスが応答していないか、ノードに到達できません。このアラートは、ノードが不明な理由で切断されたことを示しています。たとえば、ノードのサービスが停止したり、電源障害や予期しない停止によってノードのネットワーク接続が失われたりする場合があります。

このアラートを監視して、問題 が自動的に解決するかどうかを確認します。問題 が維持される場合は、次の手順

  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。

  2. このノードですべてのサービスが実行されていることを確認します。サービスが停止している場合は、開始してみてください。リカバリとメンテナンスの手順を参照してください。

  3. ノードのホストの電源がオンになっていることを確認します。表示されない場合は、ホストを起動します。

    メモ 複数のホストの電源がオフになっている場合は、リカバリとメンテナンスの手順を参照してください。
  4. このノードと管理ノードの間にネットワーク接続問題 があるかどうかを確認します。

  5. このアラートを解決できない場合は、テクニカルサポートにお問い合わせください。

""

予期しないノードのリブートです

過去 24 時間以内にノードが予期せずリブートされました。

  1. このアラートを監視します。このアラートは 24 時間後にクリアされます。ただし、ノードが予期せずにリブートされた場合、このアラートは再度トリガーされます。

  2. アラートを解決できない場合は、ハードウェア障害が発生している可能性があります。テクニカルサポートにお問い合わせください。

未識別の破損オブジェクトが検出されました

レプリケートオブジェクトストレージにファイルが見つかりましたが、レプリケートオブジェクトとして識別できませんでした。

  1. ストレージノード上の基盤となるストレージに問題がないかどうかを確認します。たとえば、ハードウェア診断を実行するか、ファイルシステムチェックを実行します。

  2. ストレージの問題を解決したら、フォアグラウンド検証を実行してオブジェクトが欠落しているかどうかを確認し、可能であれば置き換えます。

  3. このアラートを監視します。このアラートは 24 時間後にクリアされますが、問題 が修正されていない場合は再度トリガーされます。

  4. このアラートを解決できない場合は、テクニカルサポートにお問い合わせください。

  • 関連情報 *