障害ストレージ ボリュームの特定とアンマウント

ストレージ ボリュームで障害が発生したストレージ ノードをリカバリする場合は、障害ボリュームを特定し、アンマウントする必要があります。障害ストレージ ボリュームのみがリカバリ手順で再フォーマットされることを確認する必要があります。

開始する前に

Grid Managerにはサポートされているブラウザを使用してサインインする必要があります。

タスク概要

障害ストレージ ボリュームは、できるだけ早くリカバリする必要があります。

まず最初に、接続解除されたボリューム、アンマウントが必要なボリューム、またはI/Oエラーが発生しているボリュームを検出します。障害ボリュームがランダムに破損したファイルシステムを含んでいる状態で接続されている場合は、ディスクの未使用部分または未割り当て部分の破損をシステムが検出できないことがあります。ファイルシステムの整合性チェックは通常どおりに実行する必要がありますが、この手順は必要時(電源喪失時など)に大きなファイルシステムで障害ボリュームを検出する場合にのみ実行してください。

注:この手順は、手動手順(ディスクの追加や再接続、ノードの停止、ノードの開始、リブートなど)を実行する前に完了しておく必要があります。そうしないと、reformat_storage_block_devices.rbスクリプトを実行したときに、ファイルシステム エラーが発生してスクリプトがハングしたり失敗したりする場合があります。
注:rebootコマンドを実行する前に、ハードウェアを修理してディスクを適切に接続してください。
注意:
障害ストレージ ボリュームを特定する際には注意が必要です。この情報を使用して、再フォーマットが必要なボリュームを確認します。ボリュームを再フォーマットすると、そのボリュームのデータはリカバリできません。

障害が発生したストレージ ボリュームを正しくリカバリするためには、そのストレージ ボリュームのデバイス名とIDの両方を把握しておく必要があります。

インストール時に、各ストレージ デバイスにはファイルシステムのUniversal Unique Identifier(UUID)が割り当てられ、そのUUIDを使用してストレージ ノードのrangedbディレクトリにマウントされます。ファイルシステムUUIDとrangedbディレクトリは、/etc/fstabファイルに記録されます。デバイス名、rangedbディレクトリ、マウントされているボリュームのサイズは、Grid Managerに表示されます。

これらの値を確認するには、[Support] > [Grid Topology]を選択します。次に、[site] > [failed Storage Node] > [SSM] > [Resources] > [Overview] > [Main]を選択します。

次の例では、ボリューム サイズが4TBのデバイス/dev/sdc/var/local/rangedb/0にマウントされており、/etc/fstabファイル内のデバイス名/dev/disk/by-uuid/822b0547-3b2b-472e-ad5e-e1cf1809fabaを使用しています。
ボリューム サイズの例

手順

  1. 次の手順を実行して、障害ストレージ ボリュームとそのデバイス名を記録します。
    1. [Support] > [Grid Topology]を選択します。
    2. [site] > [failed Storage Node] > [LDR] > [Storage] > [Overview] > [Main]を選択し、アラームが示されているオブジェクト ストアを探します。

      [Object Stores]セクション
    3. [site] > [failed Storage Node] > [SSM] > [Resources] > [Overview] > [Main]を選択します。前の手順で特定した各障害ストレージ ボリュームのマウント ポイントとボリューム サイズを確認します。

      オブジェクト ストアには、16進表記の番号(0000~000F)が付けられます。この例では、IDが0000のオブジェクト ストアは、デバイス名がsdcでサイズが107GBの/var/local/rangedb/0に対応しています。


      オブジェクト ストアとマウント ポイントを示す例

      障害ストレージ ボリュームのボリューム番号とデバイス名を確認できない場合は、同等のストレージ ノードにログインし、そのサーバでのボリュームとデバイス名のマッピングを確認します。

      通常ストレージ ノードは、同じハードウェアとストレージ構成を使用するペアで追加されます。同等のストレージ ノードで/etc/fstabファイルを調べて、各ストレージ ボリュームに対応するデバイス名を特定します。各障害ストレージ ボリュームのデバイス名を特定し、記録します。

  2. サービス ラップトップから、障害が発生したストレージ ノードにログインします。
    1. 次のコマンドを入力します:ssh admin@grid_node_IP
    2. Passwords.txtファイルに含まれているパスワードを入力します。
    3. 次のコマンドを入力してrootに切り替えます:su -
    4. Passwords.txtファイルに含まれているパスワードを入力します。
    rootとしてログインすると、プロンプトが$から#に変わります。
  3. LDRサービスを停止し、障害ストレージ ボリュームをアンマウントします。
    1. LDRサービスを停止します。service ldr stop
    2. rangedb/0をリカバリする必要がある場合は、rangedb/0をアンマウントする前にCassandraを停止します。service cassandra stop
    3. 障害ストレージ ボリュームをアンマウントします。umount /var/local/rangedb/object_store_ID

      object_store_IDは、障害ストレージ ボリュームのIDです。たとえば、IDが0000のオブジェクト ストアのコマンドで0を指定します。