Services: Status - Cassandra(SVST)アラームのトラブルシューティング

Services: Status - Cassandra(SVST)アラームは、ストレージ ノードに対するCassandraデータベースのリビルドが必要となる可能性があることを示します。CassandraはStorageGRID用のメタデータ ストアとして使用されます。

開始する前に

タスク概要

Cassandraが16日以上停止している(ストレージ ノードの電源がオフになっているなど)場合、ノードがオンライン状態に戻ってもCassandraは起動しません。この場合、該当するDDSサービスのCassandraデータベースをリビルドする必要があります。
注意: 16日以上停止しているCassandraデータベースのサービスが複数ある場合は、この手順は実行せずにテクニカル サポートに連絡してください。

手順

  1. [Support]を選択します。次に、メニューの[Tools]セクションで[Grid Topology]を選択します。
  2. [site] > [Storage Node] > [SSM] > [Services] > [Alarms] > [Main]を選択してアラームを表示します。
    この例は、SVSTアラームがトリガーされたことを示しています。

    SSMのサービスのアラーム ページ

    SSMのサービスの[Main]ページでも、Cassandraが実行されていないことが示されます。


    SSMのサービスの概要ページ
  3. ストレージ ノードからCassandraを再起動できるか試します。
    1. グリッド ノードにログインします。
      1. 次のコマンドを入力します:ssh admin@grid_node_IP
      2. Passwords.txtファイルに含まれているパスワードを入力します。
      3. 次のコマンドを入力してrootに切り替えます:su -
      4. Passwords.txtファイルに含まれているパスワードを入力します。
      rootとしてログインすると、プロンプトが$から#に変わります。
    2. 次のように入力します。/etc/init.d/cassandra status
    3. Cassandraが実行されていない場合は再起動します。/etc/init.d/cassandra restart
  4. Cassandraが再起動されない場合は、Cassandraが停止していた期間を調べます。Cassandraが16日以上停止している場合、Cassandraデータベースをリビルドする必要があります。
    注意: Cassandraデータベースのサービスが複数停止している場合は、この手順は実行せずにテクニカル サポートに連絡してください。

    グラフを作成するか、servermanager.logファイルを確認することで、Cassandraが停止していた期間を調べることができます。

  5. Cassandraのグラフを確認する手順は次のとおりです。
    1. [Support]を選択します。次に、メニューの[Tools]セクションで[Grid Topology]を選択します。次に、[site] > [Storage Node] > [SSM] > [Services] > [Reports] > [Charts]を選択します。
    2. [Attribute] > [Service: Status - Cassandra]を選択します。
    3. [Start Date]に、現在の日付より少なくとも16日前の日付を入力します。[End Date]に、現在の日付を入力します。
    4. [Update]をクリックします。
    5. グラフからCassandraが16日以上停止していることがわかった場合は、Cassandraデータベースをリビルドします。
    次のグラフの例では、Cassandraが少なくとも17日間は停止していることがわかります。

    SSMのサービスの概要ページ
  6. ストレージ ノードでservermanager.logファイルを確認するために、次の手順を実行します。
    1. グリッド ノードにログインします。
      1. 次のコマンドを入力します:ssh admin@grid_node_IP
      2. Passwords.txtファイルに含まれているパスワードを入力します。
      3. 次のコマンドを入力してrootに切り替えます:su -
      4. Passwords.txtファイルに含まれているパスワードを入力します。
      rootとしてログインすると、プロンプトが$から#に変わります。
    2. 次のように入力します。cat /var/local/log/servermanager.log
      servermanager.logファイルの内容が表示されます。
      Cassandraが16日以上停止している場合、servermanager.logファイルに次のメッセージが表示されます。
      "2014-08-14 21:01:35 +0000 | cassandra | cassandra not 
      started because it has been offline for longer than 
      its 15 day grace period - rebuild cassandra
    3. このメッセージのタイムスタンプが手順3に従ってCassandraの再起動を試行した時間になっていることを確認してください。
      Cassandraのエントリは1つとは限らないため、最新のエントリを確認する必要があります。
    4. Cassandraが16日以上停止している場合、Cassandraデータベースをリビルドする必要があります。
      手順については、リカバリおよびメンテナンスの手順で15日以上停止している単一のストレージ ノードのリカバリを参照してください。
    5. Cassandraをリビルドしたあともアラームがクリアされない場合は、テクニカル サポートに連絡してください。