15日以上停止しているストレージ ノードのリカバリ

単一のストレージ ノードがオフラインになって他のストレージ ノードに接続されなくなってから15日以上が経過した場合は、そのノードのCassandraを再構築する必要があります。

開始する前に

タスク概要

ストレージ ノードには、オブジェクト メタデータを含むCassandraデータベースがあります。他のストレージ ノードと15日以上通信できていないストレージ ノードのCassandraデータベースは、StorageGRIDによって古いとみなされます。他のストレージ ノードからの情報を使用してCassandraが再構築されるまで、そのストレージ ノードはグリッドに再参加できません。

1つのストレージ ノードが停止している場合のみ、次の手順を使用してCassandraを再構築できます。他にもオフライン状態のストレージ ノードがある場合や、過去15日以内に別のストレージ ノードでCassandraが再構築されている場合(たとえば、障害が発生したストレージ ボリュームやストレージ ノードのリカバリ手順の一環として、Cassandraが再構築されている場合があります)は、テクニカル サポートに連絡してください。

注意:
複数のストレージ ノードがオフラインの場合、または複数のストレージ ノードで障害が発生している場合は、この手順を実行しないでください。データが失われることがあります。テクニカル サポートに連絡してください。
注意:
15日以内に複数のストレージ ノードでCassandraを再構築しないでください。15日以内に複数のストレージ ノードでCassandraを再構築すると、データが失われることがあります。テクニカル サポートに連絡してください。

手順

  1. 必要に応じて、リカバリが必要なストレージ ノードの電源をオンにします。
  2. サービス ラップトップから、グリッド ノードにログインします。
    1. 次のコマンドを入力します:ssh admin@grid_node_IP
    2. Passwords.txtファイルに含まれているパスワードを入力します。
    3. 次のコマンドを入力してrootに切り替えます:su -
    4. Passwords.txtファイルに含まれているパスワードを入力します。
    rootとしてログインすると、プロンプトが$から#に変わります。
    注:グリッド ノードにログインできない場合、システム ディスクが破損している可能性があります。その場合は、システム ドライブ障害からのリカバリ手順を参照してください。

    システム ドライブ障害および潜在的なストレージ ボリューム障害からのリカバリ

  3. ストレージ ノードで次のチェックを実行します。
    1. 次のコマンドを実行します。nodetool status
      Connection refused」と出力されます。
    2. Grid Managerで、[Support] > [Grid Topology]を選択します。 次に、[site] > [Storage Node] > [SSM] > [Services]を選択します。Cassandraサービスが[Not Running]と表示されていることを確認します。
    3. [Storage Node] > [SSM] > [Resources]を選択します。[Volumes]セクションでエラー ステータスがないことを確認します。
    4. 次のコマンドを実行します。grep -i Cassandra /var/local/log/servermanager.log
      次のメッセージが出力に表示されます。
      Cassandra not started because it has been offline for more than 15 day grace period - rebuild Cassandra
  4. 次のコマンドを実行して、スクリプトの出力を監視します。check-cassandra-rebuild
    • ストレージ サービスが実行されている場合は、停止するよう求められます。「y」と入力します。
    • スクリプト内の警告を確認します。いずれの状況も該当しない場合は、Cassandraの再構築を確定します。「y」と入力します。
  5. 再構築が完了したら、次のチェックを実行します。
    1. Grid Managerで、[Support] > [Grid Topology]を選択します。
    2. [site] > [recovered Storage Node] > [SSM] > [Services]を選択します。
    3. すべてのサービスが実行されていることを確認します。
    4. [DDS] > [Data Store]を選択します。
    5. [Data Store Status]「Up」[Data Store State]「Normal」になっていることを確認します。