SVST(Services: Status - Cassandra)アラームのトラブルシューティング

SVSTアラームは、ストレージ ノードに対するCassandraデータベースのリビルドが必要となる可能性があることを示します。CassandraはStorageGRID Webscale用のメタデータ ストアとして使用されます。

開始する前に

タスク概要

Cassandraが停止している(ストレージ ノードの電源がオフになっているなど)期間が15日を超える場合、ノードがオンライン状態に戻ってもCassandraは起動されません。この場合、該当するDDSサービスのCassandraデータベースをリビルドする必要があります。
注意:停止期間が15日を超えるCassandraデータベースのサービスが複数ある場合は、この手順は実行せずにテクニカル サポートに連絡してください。

手順

  1. [Support] > [Grid Topology]を選択します。
  2. [site] > [Storage Node] > [SSM] > [Services] > [Alarms] > [Main]を選択してアラームを表示します。
    この例は、SVSTアラームがトリガーされたことを示しています。


    SSMのサービスのアラーム ページ

    SSMのサービスの[Main]ページでも、Cassandraが実行されていないことが示されます。


    SSMのサービスの概要ページ
  3. Cassandraを再起動できるか試します。
    1. ストレージ ノードで、Passwords.txtファイルに記載されたパスワードを使用して、adminとしてログインしてからsuを実行してrootに切り替えます。
    2. 次のように入力します。/etc/init.d/cassandra status
    3. Cassandraが実行されていない場合は再起動します。/etc/init.d/cassandra restart
  4. Cassandraが再起動されない場合は、Cassandraが停止していた期間を調べます。Cassandraの停止期間が15日を超えている場合、Cassandraデータベースをリビルドする必要があります。
    注意:Cassandraデータベースのサービスが複数停止している場合は、この手順は実行せずにテクニカル サポートに連絡してください。

    グラフを作成するか、servermanager logファイルを確認することで、Cassandraが停止していた期間を調べることができます。

    Cassandraのグラフを確認する手順は次のとおりです。
    1. [Support] > [Grid Topology]を選択します。次に、[site] > [Storage Node] > [SSM] > [Services] > [Reports] > [Charts]を選択します。
    2. [Attribute] > [Service: Status - Cassandra]を選択します。
    3. [Start Data]に16日以上前の日付を入力し、[End Date]に今日の日付を入力します。
    4. [Update]をクリックします。

      グラフからCassandraの停止期間が15日を超えていることがわかった場合は、Cassandraデータベースをリビルドします。次のグラフの例では、Cassandraが少なくとも17日間は停止していることがわかります。


      SSMのサービスの概要ページ

      servermanager logファイルを確認するには、次の手順を実行します。
      1. ストレージ ノードで、Passwords.txtファイルに記載されたパスワードを使用して、adminとしてログインしてからsuを実行してrootに切り替えます。
      2. 次のように入力します。cat /var/local/log/servermanager.log

        servermanager logファイルの内容が表示されます。

      3. servermanager logファイルで、Cassandraの停止期間が15日を超えている場合は、次のメッセージが表示されます。
        "2014-08-14 21:01:35 +0000 | cassandra | cassandra not 
        started because it has been offline for longer than 
        its 15 day grace period - rebuild cassandra

        このメッセージのタイムスタンプが手順3に従ってCassandraの再起動を試行した時間になっていることを確認してください。

        Cassandraのエントリは1つとは限らないため、最新のエントリを確認する必要があります。

        Cassandraの停止期間が15日を超えている場合、Cassandraデータベースをリビルドする必要があります。手順については、リカバリおよびメンテナンスの手順で「15日以上停止している単一のストレージ ノードのリカバリ」を参照してください。

        Cassandraを再構築すると、アラームは解除されます。アラームが解除されない場合は、テクニカル サポートにお問い合わせください。