Skip to main content
本製品の最新リリースがご利用いただけます。
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

15日以上停止しているストレージノードのリカバリ

共同作成者

単一のストレージノードがオフラインになって他のストレージノードに接続されなくなってから 15 日以上が経過した場合は、そのノードで Cassandra を再構築する必要があります。

必要なもの
  • ストレージノードの運用停止処理が進行中でないこと、またはノードの手順 の運用停止処理が一時停止されていることを確認しておきます(Grid Managerで、* Maintenance * Maintenance Tasks * Decommission *を選択します)。

  • 拡張が進行中でないことを確認しておきます(Grid Managerで、* Maintenance * Maintenance Tasks * Expansion *を選択します。)

このタスクについて

ストレージノードには、オブジェクトメタデータを含む Cassandra データベースがあります。他のストレージノードと 15 日以上通信できていないストレージノードの Cassandra データベースは、 StorageGRID によって古いとみなされます。他のストレージノードからの情報を使用して Cassandra が再構築されるまで、そのストレージノードはグリッドに再参加できません。

この手順 は、 1 つのストレージノードが停止している場合にのみ Cassandra を再構築するために使用します。追加のストレージノードがオフラインの場合や、 15 日以内に別のストレージノードで Cassandra が再構築されている場合は、テクニカルサポートにお問い合わせください。たとえば、障害ストレージボリュームのリカバリ手順または障害ストレージノードのリカバリ手順の一環として Cassandra が再構築されている可能性があります。

注意 複数のストレージノードで障害が発生した場合(またはオフラインの場合)は、テクニカルサポートにお問い合わせください。次のリカバリ手順 は実行しないでください。データが失われる可能性があります。
注意 ストレージノードの障害またはリカバリ後 15 日以内に 2 つ目のストレージノードの障害が発生した場合は、テクニカルサポートにお問い合わせください。次のリカバリ手順 は実行しないでください。データが失われる可能性があります。
メモ サイトの複数のストレージノードで障害が発生した場合は、サイトリカバリ手順 が必要になる可能性があります。テクニカルサポートにお問い合わせください。
手順
  1. 必要に応じて、リカバリが必要なストレージノードの電源をオンにします。

  2. グリッドノードにログインします。

    1. 次のコマンドを入力します。 ssh admin@grid_node_IP

    2. に記載されているパスワードを入力します Passwords.txt ファイル。

    3. 次のコマンドを入力してrootに切り替えます。 su -

    4. に記載されているパスワードを入力します Passwords.txt ファイル。

    rootとしてログインすると、プロンプトがから変わります $ 終了: #.+

メモ グリッドノードにログインできない場合は、システムディスクが破損している可能性があります。手順 にアクセスして、システムドライブ障害からのリカバリを実行します。 "システムドライブ障害からのリカバリ"
  1. ストレージノードで次のチェックを実行します。

    1. 問題コマンド: nodetool status

      出力がになっている必要があります Connection refused

    2. Grid Managerで、* Support ** Tools * Grid Topology *を選択します。

    3. _site ストレージノード SSM *サービス*を選択します。Cassandraサービスが表示されていることを確認します Not Running

    4. Storage Node * SSM * Resources *を選択します。ボリュームセクションにエラーステータスがないことを確認します。

    5. 問題コマンド: grep -i Cassandra /var/local/log/servermanager.log

      出力に次のメッセージが表示されます。

    Cassandra not started because it has been offline for more than 15 day grace period - rebuild Cassandra
  2. 問題 :このコマンドを使用して、スクリプトの出力を監視します。 check-cassandra-rebuild

    • ストレージサービスが実行されている場合は、それらを停止するように求められます。「 * y * 」と入力します

    • スクリプト内の警告を確認します。いずれの状況も該当しない場合は、 Cassandra の再構築を確定します。「 * y * 」と入力します

      メモ 一部の StorageGRID リカバリ手順では、 Reaper を使用して Cassandra の修復を処理します。関連サービスまたは必要なサービスが開始されるとすぐに修理が自動的に行われます。スクリプトの出力には、「 reaper 」または「 Cassandra repair 」が含まれていることがあります。 修復が失敗したことを示すエラーメッセージが表示された場合は、エラーメッセージに示されたコマンドを実行します。
  3. リビルドが完了したら、次のチェックを実行します。

    1. Grid Managerで、* Support ** Tools * Grid Topology *を選択します。

    2. _site _*リカバリ済みストレージノード* SSM *サービス*を選択します。

    3. すべてのサービスが実行されていることを確認します。

    4. DDS *データストア*を選択します。

    5. * データ・ストアのステータス * が「アップ」であり、 * データ・ストアの状態 * が「通常」であることを確認します。