アラート一覧

次の表は、StorageGRIDのデフォルト アラートの一覧です。必要に応じて、システムの管理方法に合わせたカスタムのアラート ルールを作成できます。

一部のアラートで使用されているPrometheus指標については、主要なPrometheus指標に関する情報を参照してください。
アラート名 説明および推奨される対処方法
Appliance battery expired アプライアンスのストレージ コントローラのバッテリの有効期限が切れています。
  1. バッテリを交換します。バッテリを取り外して交換する手順については、アプライアンスのインストールとメンテナンスの手順のストレージ コントローラの交換手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance battery failed アプライアンスのストレージ コントローラのバッテリで障害が発生しました。
  1. バッテリを交換します。バッテリを取り外して交換する手順については、アプライアンスのインストールとメンテナンスの手順のストレージ コントローラの交換手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance battery has insufficient learned capacity アプライアンスのストレージ コントローラのバッテリ残量が十分ではありません。
  1. バッテリを交換します。バッテリを取り外して交換する手順については、アプライアンスのインストールとメンテナンスの手順のストレージ コントローラの交換手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance battery near expiration アプライアンスのストレージ コントローラのバッテリの有効期限が近づいています。
  1. できるだけ早くバッテリを交換します。バッテリを取り外して交換する手順については、アプライアンスのインストールとメンテナンスの手順のストレージ コントローラの交換手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance battery removed アプライアンスのストレージ コントローラにバッテリがありません。
  1. バッテリを取り付けます。バッテリを取り外して交換する手順については、アプライアンスのインストールとメンテナンスの手順のストレージ コントローラの交換手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance battery too hot アプライアンスのストレージ コントローラのバッテリが過熱しています。
  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  2. ファンやHVACの故障など、温度上昇の原因となる問題がないか調べます。
  3. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance cache backup device failed 永続的なキャッシュ バックアップ デバイスで障害が発生しました。
  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  2. テクニカル サポートに連絡してください。
Appliance cache backup device insufficient capacity キャッシュ バックアップ デバイスの容量が十分ではありません。

テクニカル サポートに連絡してください。

Appliance cache backup device write-protected キャッシュ バックアップ デバイスが書き込み禁止になっています。

テクニカル サポートに連絡してください。

Appliance cache memory size mismatch アプライアンスの2台のコントローラでキャッシュ サイズが異なります。

テクニカル サポートに連絡してください。

Appliance compute controller chassis temperature too high StorageGRIDアプライアンスのコンピューティング コントローラの温度が公称のしきい値を超えています。
  1. ハードウェア コンポーネントの過熱状況を調べ、推奨される対処方法に従います。
    • SG100、SG1000、またはSG6000の場合は、BMCを使用します。
    • SG5600またはSG5700の場合は、SANtricity System Managerを使用します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance compute controller CPU temperature too high StorageGRIDアプライアンスのコンピューティング コントローラのCPUの温度が公称のしきい値を超えています。
  1. ハードウェア コンポーネントの過熱状況を調べ、推奨される対処方法に従います。
    • SG100、SG1000、またはSG6000の場合は、BMCを使用します。
    • SG5600またはSG5700の場合は、SANtricity System Managerを使用します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance compute controller needs attention StorageGRIDアプライアンスのコンピューティング コントローラでハードウェア エラーが検出されました。
  1. ハードウェア コンポーネントのエラーを調べ、推奨される対処方法に従います。
    • SG100、SG1000、またはSG6000の場合は、BMCを使用します。
    • SG5600またはSG5700の場合は、SANtricity System Managerを使用します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance compute controller power supply A has a problem コンピューティング コントローラの電源装置Aに問題があります。

電源装置で障害が発生したか、電源の供給に問題がある可能性があります。

  1. ハードウェア コンポーネントのエラーを調べ、推奨される対処方法に従います。
    • SG100、SG1000、またはSG6000の場合は、BMCを使用します。
    • SG5600またはSG5700の場合は、SANtricity System Managerを使用します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance compute controller power supply B has a problem コンピューティング コントローラの電源装置Bに問題があります。

電源装置で障害が発生したか、電源の供給に問題がある可能性があります。

  1. ハードウェア コンポーネントのエラーを調べ、推奨される対処方法に従います。
    • SG100、SG1000、またはSG6000の場合は、BMCを使用します。
    • SG5600またはSG5700の場合は、SANtricity System Managerを使用します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance compute hardware monitor service stalled ストレージ ハードウェアのステータスを監視するサービスがデータの報告を停止しています。
  1. 基本OSでeos-system-statusサービスのステータスを確認します。
  2. サービスが停止しているかエラー状態の場合は、サービスを再起動します。
  3. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance flash cache drives non-optimal SSDキャッシュに使用されているドライブが最適な状態ではありません。
  1. SSDキャッシュ ドライブを交換します。アプライアンスのインストールとメンテナンスの手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance interconnect/battery canister removed インターコネクト / バッテリ キャニスターがありません。
  1. バッテリを交換します。バッテリを取り外して交換する手順については、アプライアンスのインストールとメンテナンスの手順のストレージ コントローラの交換手順を参照してください。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance overall power supply degraded StorageGRIDアプライアンスの電源が推奨される動作電圧ではありません。
  1. 電源装置AとBのステータスを調べてどちらの電源装置に異常があるかを確認し、推奨される対処方法に従います。
    • SG100、SG1000、またはSG6000の場合は、BMCを使用します。
    • SG5600またはSG5700の場合は、SANtricity System Managerを使用します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage connectivity degraded コンピューティング コントローラとストレージ コントローラの間の接続に問題があります。
  1. アプライアンスでポートのインジケータ ライトを確認します。
  2. ライトが消灯している場合は、ケーブルが正しく接続されていることを確認します。必要に応じて、ケーブルを交換します。
  3. 5分ほど待ちます。
    注: ほかにも交換が必要なケーブルがある場合、少なくとも5分間は次のケーブルを取り外さないでください。そうしないと、ルート ボリュームが読み取り専用になり、ハードウェアの再起動が必要になることがあります。
  4. Grid Managerで、[Nodes]を選択します。次に、問題があるノードの[Hardware]タブを選択します。アラートの状態が解決されたことを確認します。
Appliance storage controller A failure StorageGRIDアプライアンスのストレージ コントローラAで障害が発生しました。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage controller B failure StorageGRIDアプライアンスのストレージ コントローラBで障害が発生しました。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage controller drive failure StorageGRIDアプライアンスの1つ以上のドライブで障害が発生したか最適な状態ではありません。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage controller hardware issue StorageGRIDアプライアンスのコンポーネントについて、SANtricityソフトウェアから「Needs attention」が報告されています。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage controller power supply A failure StorageGRIDアプライアンスの電源装置Aが推奨される動作電圧ではありません。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage controller power supply B failure StorageGRIDアプライアンスの電源装置Bが推奨される動作電圧ではありません。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance storage hardware monitor service stalled ストレージ ハードウェアのステータスを監視するサービスがデータの報告を停止しています。
  1. 基本OSでeos-system-statusサービスのステータスを確認します。
  2. サービスが停止しているかエラー状態の場合は、サービスを再起動します。
  3. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance storage shelves power supply degraded ストレージ アプライアンスのストレージ シェルフのいずれかのコンポーネントがデグレード状態です。
  1. SANtricity System Managerを使用してハードウェア コンポーネントを調べ、推奨される対処方法に従います。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Appliance temperature exceeded アプライアンスのストレージ コントローラの温度が公称温度または最大温度を超えています。
  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  2. ファンやHVACの故障など、温度上昇の原因となる問題がないか調べます。
  3. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Appliance temperature sensor removed 温度センサーが取り外されています。テクニカル サポートに連絡してください。
Cassandra communication error Cassandraサービスを実行するノード間の相互通信に問題があります。

このアラートは、何らかの理由でノード間の通信に影響が出ている場合に表示されます。ネットワークに問題があるか、1つ以上のストレージ ノードでCassandraサービスが停止している可能性があります。

  1. ストレージ ノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  2. ストレージ ノードに影響している可能性があるネットワークの問題がないかを確認します。
  3. [Support] > [Grid Topology]を選択します。
  4. システムの各ストレージ ノードについて、[SSM] > [Services]を選択します。CassandraサービスのステータスがRunningであることを確認します。
  5. Cassandraが実行されていない場合は、リカバリとメンテナンスの手順のサービスを開始または再開する手順に従います。
  6. Cassandraサービスのすべてのインスタンスが実行中でもアラートが解決しない場合は、テクニカル サポートに連絡してください。

リカバリおよびメンテナンス ガイド

Cassandra repair metrics out of date Cassandraの修復ジョブの指標が最新ではありません。この状況が48時間以上続くと、バケット リストの表示などのクライアント クエリに削除されたデータが表示されることがあります。
  1. ノードをリブートします。Grid Managerで、[Nodes]に移動してノードを選択し、[Tasks]タブを選択します。
  2. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
Cassandra repair progress slow Cassandraデータベースの修復スピードが遅くなっています。
データベースの修復スピードが遅いと、Cassandraのデータ整合性処理に影響が及びます。この状況が48時間以上続くと、バケット リストの表示などのクライアント クエリに削除されたデータが表示されることがあります。
  1. このアラートを最大2日間監視して、問題が自然に解決するかどうかを確認します。
  2. データベースの修復スピードが速くならない場合は、テクニカル サポートに連絡してください。
Cassandra repair service not available Cassandra修復サービスを使用できません。

Cassandra修復サービスはすべてのストレージ ノードにあり、Cassandraデータベースに重要な修復機能を提供します。この状況が48時間以上続くと、バケット リストの表示などのクライアント クエリに削除されたデータが表示されることがあります。

  1. [Support] > [Grid Topology]を選択します。
  2. システムの各ストレージ ノードについて、[SSM] > [Services]を選択します。Cassandra Reaperサービスのステータスが「Running」であることを確認します。
  3. Cassandra Reaperが実行されていない場合は、リカバリとメンテナンスの手順のサービスを開始または再開する手順に従います。
  4. Cassandra Reaperサービスのすべてのインスタンスが実行中でもアラートが解決しない場合は、テクニカル サポートに連絡してください。

リカバリおよびメンテナンス ガイド

Cloud Storage Pool connectivity error クラウド ストレージ プールの健全性チェックで、新たなエラーが1つ以上検出されました。
  1. [Storage Pools]ページの[Cloud Storage Pools]セクションに移動します。
  2. [Last Error]列で、エラーが発生しているクラウド ストレージ プールを特定します。
  3. StorageGRIDの管理手順を参照してください。

StorageGRIDの管理

DHCP lease expired ネットワーク インターフェイスのDHCPリースの期限が切れています。
DHCPリースの期限が切れている場合は、推奨される対処方法に従います。
  1. 該当するインターフェイスで、このノードとDHCPサーバの接続が確立されていることを確認します。
  2. DHCPサーバの該当するサブネットに、割り当て可能なIPアドレスがあることを確認します。
  3. DHCPサーバで設定されているIPアドレスが永続的に予約されていることを確認します。または、StorageGRIDのIP変更ツールを使用して、DHCPアドレス プールに属していない静的IPアドレスを割り当てます。リカバリとメンテナンスの手順を参照してください。

リカバリおよびメンテナンス ガイド

DHCP lease expiring soon ネットワーク インターフェイスのDHCPリースの期限がまもなく切れます。
DHCPリースが期限切れにならないようにするには、推奨される対処方法に従います。
  1. 該当するインターフェイスで、このノードとDHCPサーバの接続が確立されていることを確認します。
  2. DHCPサーバの該当するサブネットに、割り当て可能なIPアドレスがあることを確認します。
  3. DHCPサーバで設定されているIPアドレスが永続的に予約されていることを確認します。または、StorageGRIDのIP変更ツールを使用して、DHCPアドレス プールに属していない静的IPアドレスを割り当てます。リカバリとメンテナンスの手順を参照してください。

リカバリおよびメンテナンス ガイド

DHCP server unavailable DHCPサーバを使用できません。

StorageGRIDノードからDHCPサーバに接続できません。ノードのIPアドレスのDHCPリースを検証できません。

  1. 該当するインターフェイスで、このノードとDHCPサーバの接続が確立されていることを確認します。
  2. DHCPサーバの該当するサブネットに、割り当て可能なIPアドレスがあることを確認します。
  3. DHCPサーバで設定されているIPアドレスが永続的に予約されていることを確認します。または、StorageGRIDのIP変更ツールを使用して、DHCPアドレス プールに属していない静的IPアドレスを割り当てます。リカバリとメンテナンスの手順を参照してください。

リカバリおよびメンテナンス ガイド

Email notification failure アラートのEメール通知を送信できませんでした。

このアラートは、アラートのEメール通知に失敗した場合、またはテスト用Eメール([Alerts] > [Email Setup]ページから送信)を配信できない場合にトリガーされます。

  1. アラートの[Site/Node]列に表示された管理ノードからGrid Managerにサインインします。
  2. [Alerts] > [Email Setup]ページに移動して設定を確認し、必要に応じて変更します。
  3. [Send Test Email]をクリックし、Eメールのテスト受信者の受信ボックスを確認します。テスト用Eメールを送信できない場合、このアラートの新しいインスタンスがトリガーされることがあります。
  4. テスト用Eメールを送信できなかった場合は、Eメール サーバがオンラインであることを確認します。
  5. サーバが稼働している場合は、[Support] > [Logs]に移動し、管理ノードのログを収集します。アラートの前後15分の期間を指定します。
  6. ダウンロードしたアーカイブを展開し、prometheus.log/GID<gid><time_stamp>/<site_node>/<time_stamp>/metrics/prometheus.log)の内容を確認します。
  7. 問題を解決できない場合は、テクニカル サポートにお問い合わせください。
Expiration of load balancer endpoint certificate 1つ以上のロード バランサ エンドポイント証明書の有効期限が近づいています。
  1. [Configuration] > [Load Balancer Endpoints]に移動します。
  2. 証明書の有効期限がまもなく切れるエンドポイントを選択します。
  3. [Edit endpoint]を選択して、新しい証明書をアップロードするか生成します。
  4. 証明書の有効期限が切れているかまもなく切れるエンドポイントごとに、上記の手順を繰り返します。

ロード バランサ エンドポイントの管理の詳細については、StorageGRIDの管理手順を参照してください。

StorageGRIDの管理

Expiration of server certificate for Management Interface 管理インターフェイスで使用されるサーバ証明書の有効期限が近づいています。
  1. [Configuration] > [Server Certificates]に移動します。
  2. [Management Interface Server Certificate]セクションで、新しい証明書をアップロードします。

StorageGRIDの管理

Expiration of server certificate for Storage API Endpoints ストレージAPIエンドポイントへのアクセスに使用されるサーバ証明書の有効期限が近づいています。
  1. [Configuration] > [Server Certificates]に移動します。
  2. [Object Storage API Service Endpoints Server Certificate]セクションで、新しい証明書をアップロードします。

StorageGRIDの管理

Grid Network MTU mismatch グリッド ネットワーク インターフェイス(eth0)の最大伝送ユニット(MTU)設定がグリッド内のノード間で大きく異なっています。

MTU設定が異なる場合、一部のeth0ネットワークがジャンボ フレーム用に設定されている可能性があります。MTUサイズの差が1000よりも大きいと、ネットワークのパフォーマンスに問題が発生することがあります。

Grid Network MTU mismatchアラートのトラブルシューティング

High Java heap use Javaのヒープ スペースの使用率が高くなっています。

Javaのヒープがいっぱいになると、メタデータ サービスを使用できなくなり、クライアント要求が失敗することがあります。

  1. ダッシュボードでILMのアクティビティを確認します。このアラートは、ILMのワークロードが減少すると自然に解決することがあります。
  2. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  3. このアラートが解決しない場合は、テクニカル サポートに連絡してください。
High latency for metadata queries Cassandraメタデータ クエリの平均時間が長すぎます。
ディスク交換などのハードウェアの変更や、取り込みの急増などのワークロードの変化があると、クエリのレイテンシが増大することがあります。
  1. クエリのレイテンシが増大した時間帯に、ハードウェアやワークロードの変化がなかったかを確認します。
  2. 問題を解決できない場合は、テクニカル サポートにお問い合わせください。
Identity federation synchronization failure アイデンティティ ソースからフェデレーテッド グループおよびフェデレーテッド ユーザを同期できません。
  1. 設定されているLDAPサーバがオンラインで使用可能であることを確認します。
  2. [Identity Federation]ページで設定を確認します。すべての値が最新であることを確認します。StorageGRIDの管理手順のフェデレーテッド アイデンティティ ソースの設定を参照してください。
  3. [Test Connection]をクリックしてLDAPサーバの設定を検証します。
  4. この問題を解決できない場合は、テクニカル サポートにお問い合わせください。

StorageGRIDの管理

ILM placement unachievable 一部のオブジェクトで、ILMルールの配置手順を実行できません。
配置手順に指定されているノードを使用できないか、ILMルールの設定に誤りがある可能性があります。たとえば、ストレージ ノードよりも多くのレプリケート コピーが指定されている場合などです。
  1. すべてのノードがオンラインであることを確認します。
  2. すべてのノードがオンラインの場合は、アクティブなILMポリシーで使用されているすべてのILMルールの配置手順を確認します。すべてのオブジェクトに対して有効な手順があることを確認します。StorageGRIDの管理手順を参照してください。
  3. 必要に応じて、ルールの設定を更新し、新しいポリシーをアクティブ化します。
    注: アラートがクリアされるまでに最大で1日かかる場合があります。
  4. 問題が引き続き発生する場合は、テクニカル サポートに連絡してください。
注: このアラートはアップグレード中に表示されることがあり、アップグレードが正常に完了してから1日はクリアされない場合があります。このアラートがアップグレードによってトリガーされた場合は自然にクリアされます。

StorageGRIDの管理

ILM scan period too long ILMのスキャン、オブジェクトの評価、および適用にかかる時間が長すぎます。
ILMによるすべてのオブジェクトのフル スキャンが完了するまでの推定時間(ダッシュボードの[Scan Period - Estimated]を参照)が長すぎる場合、新しく取り込まれたオブジェクトにアクティブなILMポリシーが適用されない可能性があります。ILMポリシーに対する変更が既存のオブジェクトに適用されないこともあります。
  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  2. すべてのストレージ ノードがオンラインであることを確認します。
  3. クライアント トラフィックの量を一時的に減らします。たとえば、Grid Manager[Configuration] > [Traffic Classification Policies]を選択し、帯域幅または要求数を制限するポリシーを作成します。
  4. ディスクI/OまたはCPUが過負荷状態になっている場合は、負荷を減らすかリソースを増やします。
  5. 必要に応じて、同期配置を使用するようにILMルールを更新します(StorageGRID 11.3以降に作成されたルールではデフォルト)。
  6. このアラートが解決しない場合は、テクニカル サポートに連絡してください。

StorageGRIDの管理

ILM scan rate low ILMスキャン速度が100オブジェクト/秒未満に設定されています。

このアラートは、システムのILMスキャン速度が100オブジェクト/秒未満に変更された場合に表示されます(デフォルトは400オブジェクト/秒)。新しく取り込まれたオブジェクトにアクティブなILMポリシーが適用されない可能性があります。ILMポリシーに対するこれ以降の変更は、既存のオブジェクトには適用されません。

  1. サポート調査の一環でILMスキャン速度が一時的に変更されていないかどうかを確認します。
  2. テクニカル サポートに連絡してください。
注意: ILMスキャン速度を変更する際は、必ずテクニカル サポートに連絡してください。
Large audit queue 監査メッセージのディスク キューがいっぱいです。
  1. システムの負荷を確認します。大量のトランザクションが発生していた場合は、時間が経つとアラートが自然に解決されるので、このアラートは無視してかまいません。
  2. アラートが解除されず重大度が上がった場合は、キュー サイズのグラフを確認します。数時間から数日にわたって数値が増え続けている場合は、監査の負荷がシステムの監査キャパシティを超えている可能性があります。
  3. クライアントの稼働率を下げるか、[Client Writes]と[Client Reads]([Configuration] > [Audit])の監査レベルを「Error」または「Off」に変更して、ログに記録される監査メッセージの数を減らします。

監査メッセージ リファレンス

Low audit log disk capacity 監査ログに使用できるスペースが少なくなっています。
  1. このアラートを監視して、問題が自然に解決し、ディスク スペースが再び使用可能になるかどうかを確認します。
  2. 使用可能なスペースが減少し続ける場合は、テクニカル サポートに連絡してください。
Low available node memory ノードの使用可能なRAMの容量が少なくなっています。
使用可能なRAMが少なくなった場合は、ワークロードに変化があったか、1つ以上のノードでメモリ リークが発生している可能性があります。
  1. このアラートを監視して、問題が自然に解決するかどうかを確認します。
  2. 使用可能なメモリがMajorアラートのしきい値を下回った場合は、テクニカル サポートに連絡してください。
Low installed node memory ノードに搭載されているメモリの容量が少なくなっています。
仮想マシンまたはLinuxホストで使用できるRAMの容量を増やしてください。Majorアラートのしきい値を確認して、StorageGRIDノードのデフォルトの最小要件を決定します。使用するプラットフォームに対応したインストール手順を参照してください。
Low metadata storage オブジェクト メタデータを格納できるスペースが少なくなっています。
Criticalアラート
  1. オブジェクトの取り込みを停止します。
  2. 拡張手順を使用してただちにストレージ ノードを追加します。

Majorアラート

拡張手順を使用してただちにストレージ ノードを追加します。

Minorアラート
  1. オブジェクト メタデータ スペースの使用率を監視します。[Nodes] > [Storage Nodes] > [Storage]を選択し、[Storage Used - Object Metadata]グラフを確認します。
  2. 拡張手順を使用してできるだけ早くストレージ ノードを追加します。

新しいストレージ ノードが追加されると、すべてのストレージ ノード間でオブジェクト メタデータが自動的にリバランシングされ、アラームが解除されます。

Low metadata storageアラートのトラブルシューティング

StorageGRIDシステムの拡張

Low metrics disk capacity 指標データベースに使用できるスペースが少なくなっています。
  1. このアラートを監視して、問題が自然に解決し、ディスク スペースが再び使用可能になるかどうかを確認します。
  2. 使用可能なスペースが減少し続ける場合は、テクニカル サポートに連絡してください。
Low object data storage オブジェクト データを格納できるスペースが少なくなっています。

拡張手順を実行します。既存のストレージ ノードにストレージ ボリューム(LUN)を追加するか、または新しいストレージ ノードを追加することができます。

Low object data storageアラートのトラブルシューティング

StorageGRIDシステムの拡張

Low root disk capacity ルート ディスクに使用できるスペースが少なくなっています。
  1. このアラートを監視して、問題が自然に解決し、ディスク スペースが再び使用可能になるかどうかを確認します。
  2. 使用可能なスペースが減少し続ける場合は、テクニカル サポートに連絡してください。
Low system data capacity /var/localファイルシステムでStorageGRIDシステム データに使用できるスペースが少なくなっています。
  1. このアラートを監視して、問題が自然に解決し、ディスク スペースが再び使用可能になるかどうかを確認します。
  2. 使用可能なスペースが減少し続ける場合は、テクニカル サポートに連絡してください。
Node network connectivity error ノード間でデータを転送しているときにエラーが発生しました。

ネットワーク接続エラーは、何もしなくても自然に解消されることがあります。エラーが解消されない場合は、テクニカル サポートに連絡してください。

Network Receive Error(NRER)アラームのトラブルシューティング

Node not in sync with NTP server ノードの時刻がネットワーク タイム プロトコル(NTP)サーバと同期されていません。
  1. Stratum 3以上の外部NTPサーバが4つ以上指定されていることを確認します。
  2. すべてのNTPサーバが正常に動作していることを確認します。
  3. NTPサーバへの接続を確認し、 ファイアウォールでブロックされていないことを確認します。
Node not locked with NTP server ノードがネットワーク タイム プロトコル(NTP)サーバにロックされていません。
  1. Stratum 3以上の外部NTPサーバが4つ以上指定されていることを確認します。
  2. すべてのNTPサーバが正常に動作していることを確認します。
  3. NTPサーバへの接続を確認し、 ファイアウォールでブロックされていないことを確認します。
Non appliance node network down 1つ以上のネットワーク デバイスが停止しているか切断されています。

このアラートは、仮想マシンまたはLinuxホストにインストールされているノードのネットワーク インターフェイス(eth)にアクセスできない場合に表示されます。

テクニカル サポートに連絡してください。

Objects lost グリッドから1つ以上のオブジェクトが失われました。
データが永続的に失われて読み出し不能になっている可能性があります。
  1. このアラートはすぐに調査してください。これ以上のデータ損失を防ぐための対処が必要になることがあります。迅速に対処すれば、損失オブジェクトをリストアできる場合もあります。

    オブジェクト データの損失と欠落のトラブルシューティング

  2. 原因となっている問題が解決したら、カウンタをリセットします。
    1. [Support]を選択します。次に、メニューの[Tools]セクションで[Grid Topology]を選択します。
    2. アラートが発生したストレージ ノードについて、[site] > [grid node] > [LDR] > [Data Store] > [Configuration] > [Main]を選択します。
    3. [Reset Lost Objects Count]を選択し、[Apply Changes]をクリックします。
Platform services unavailable 実行中または利用可能な状態の、RSMサービスを搭載したストレージ ノードがサイトで不足しています。

該当するサイトで、RSMサービスを搭載したストレージ ノードの大部分がエラーのない状態で稼働中であることを確認します。

StorageGRIDの管理手順のプラットフォーム サービスのトラブルシューティングを参照してください。

StorageGRIDの管理

S3 multipart part too small S3クライアントがAmazon S3のサイズ制限を満たさないマルチ パートをアップロードしようとしています。
  1. アラートの詳細に表示されたテナントIDを使用して、テナント アカウントを特定します。
  2. アラートの詳細に表示されたIPアドレスを使用して、S3クライアントを特定します。
  3. すべてのクライアント ユーザにマルチパート アップロードの各パートのサイズを5MiB~5GiBにするように伝えます。最後のパートだけは5MiB(5,242,880バイト)未満でもかまいません。
  4. 必要に応じて、StorageGRIDの最小サイズ制限を一時的に無効にします。
    1. プライマリ管理ノードにログインします。ssh admin@grid_node_IP
    2. Passwords.txtのパスワードを入力します。
    3. rootに切り替えます。su-
    4. 次のスクリプトを実行します。
      '/usr/local/mgmt-api/app/scripts/s3-multipart-part-size-enforcement.rb --disable'

      (この変更を元に戻す場合は--enableを使用します)

      注: このスクリプトは、StorageGRID 11.5では削除されます。次のリリースにアップグレードしたあとは、すべてのS3クライアントが5MiB~5GiBのパート サイズを使用する必要があります。

S3 multipart part too smallアラートのトラブルシューティング

Services appliance link down on Admin Network port 1 アプライアンスの管理ネットワーク ポート1が停止しているか切断されています。
  1. 管理ネットワーク ポート1のケーブルと物理的な接続状況を確認します。
  2. 接続に問題がある場合は対処します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
  3. このポートを意図的に切断している場合は、このルールを無効にします。Grid Managerで、[Alert] > Rules]を選択し、ルールを選択して[Edit rule]をクリックします。次に、[Enabled]チェック ボックスをオフにします。
Services appliance link down on Grid Network (or Admin Network or Client Network) アプライアンスのグリッド ネットワーク(eth0)、管理ネットワーク(eth1)、またはクライアント ネットワーク(eth2)へのインターフェイスが停止しているか切断されています。
  1. StorageGRIDネットワークのケーブル、SFP、および物理的な接続状況を確認します。
  2. 接続に問題がある場合は対処します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
  3. このポートを意図的に切断している場合は、このルールを無効にします。Grid Managerで、[Alert] > [Rules]を選択し、ルールを選択して[Edit rule]をクリックします。次に、[Enabled]チェック ボックスをオフにします。
Services appliance link down on network port 1, 2, 3, or 4 アプライアンスのネットワーク ポート1、2、3、または4が停止しているか切断されています。
  1. StorageGRIDネットワークのケーブル、SFP、および物理的な接続状況を確認します。
  2. 接続に問題がある場合は対処します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
  3. このポートを意図的に切断している場合は、このルールを無効にします。Grid Managerで、[Alert] > [Rules]を選択し、ルールを選択して[Edit rule]をクリックします。次に、[Enabled]チェック ボックスをオフにします。
Storage appliance link down on Admin Network port 1 アプライアンスの管理ネットワーク ポート1が停止しているか切断されています。
  1. 管理ネットワーク ポート1のケーブルと物理的な接続状況を確認します。
  2. 接続に問題がある場合は対処します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
  3. このポートを意図的に切断している場合は、このルールを無効にします。Grid Managerで、[Alert] > [Rules]を選択し、ルールを選択して[Edit rule]をクリックします。次に、[Enabled]チェック ボックスをオフにします。
Storage appliance link down on Grid Network (or Admin Network or Client Network) アプライアンスのグリッド ネットワーク(eth0)、管理ネットワーク(eth1)、またはクライアント ネットワーク(eth2)へのインターフェイスが停止しているか切断されています。
  1. StorageGRIDネットワークのケーブル、SFP、および物理的な接続状況を確認します。
  2. 接続に問題がある場合は対処します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
  3. このポートを意図的に切断している場合は、このルールを無効にします。Grid Managerで、[Alert] > Rules]を選択し、ルールを選択して[Edit rule]をクリックします。次に、[Enabled]チェック ボックスをオフにします。
Storage appliance link down on network port 1, 2, 3, or 4 アプライアンスのネットワーク ポート1、2、3、または4が停止しているか切断されています。
  1. StorageGRIDネットワークのケーブル、SFP、および物理的な接続状況を確認します。
  2. 接続に問題がある場合は対処します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
  3. このポートを意図的に切断している場合は、このルールを無効にします。Grid Managerで、[Alert] > [Rules]を選択し、ルールを選択して[Edit rule]をクリックします。次に、[Enabled]チェック ボックスをオフにします。
Storage device inaccessible ストレージ デバイスにアクセスできません。

このアラートは、ボリュームの基盤となるストレージ デバイスの問題が原因でマウントまたはアクセスできない場合に表示されます。

  1. ノードに使用しているすべてのストレージ デバイスのステータスを確認します。
  2. 必要に応じて、コンポーネントを交換します。アプライアンス ハードウェアのインストールとメンテナンスの手順を参照してください。
Unable to communicate with node 1つ以上のサービスが応答していないか、ノードに到達できません。

このアラートは、ノードが切断されていて原因が不明な場合に表示されます。たとえば、ノードのサービスが停止していたり、電源障害や予期しない停止によってノードのネットワーク接続が失われている可能性があります。

このアラートを監視して、問題が自然に解決するかどうかを確認します。問題が解決しない場合は、次の手順を実行します。
  1. このノードに影響している別のアラートがないかを確認します。他のアラートを解決することで、このアラートが解決する可能性があります。
  2. このノードですべてのサービスが実行されていることを確認します。停止しているサービスがある場合は、開始します。リカバリとメンテナンスの手順を参照してください。
  3. ノードのホストの電源がオンになっていることを確認します。オンになっていない場合は、ホストを起動します。
    注: 複数のホストの電源がオフになっている場合は、リカバリとメンテナンスの手順を参照してください。
  4. このノードと管理ノードの間にネットワーク接続の問題が発生していないかどうかを確認します。
  5. アラートが解決しない場合は、テクニカル サポートに連絡してください。

リカバリおよびメンテナンス ガイド

Unidentified corrupt object detected レプリケート オブジェクトとして識別できないファイルがレプリケート オブジェクトのストレージで見つかりました。
  1. ストレージ ノードの基盤となるストレージに問題がないかどうかを確認します。たとえば、ハードウェア診断を実行するか、ファイルシステム チェックを実行します。
  2. ストレージの問題を解決したら、フォアグラウンド検証を実行してオブジェクトの欠落がないかを確認し、可能であれば置き換えます。
  3. このアラートを監視します。このアラートは24時間後にクリアされますが、問題が解決していない場合は再度トリガーされます。
  4. アラートが解決しない場合は、テクニカル サポートに連絡してください。

フォアグラウンド検証の実行