障害ストレージ ボリュームの特定とアンマウント

ストレージ ボリュームに障害が発生したストレージ ノードをリカバリする場合は、障害ストレージ ボリュームを特定し、アンマウントする必要があります。

開始する前に

グリッド管理インターフェイスにはサポートされているブラウザを使用してサインインする必要があります。

タスク概要

障害ストレージ ボリュームは、できるだけ早くリカバリする必要があります。ストレージ ノードで障害ストレージ ボリュームを特定してアンマウントし、障害ストレージ ボリュームのみがリカバリ手順の一環として再フォーマットされることを確認するとともに、障害ストレージ ボリュームに対応するデバイス名を特定します。

まず最初に、接続解除されたボリューム、アンマウントが必要なボリューム、またはI/Oエラーが発生しているボリュームを検出します。障害ボリュームがランダムに破損したファイルシステムを含んでいる状態で接続されている場合は、ディスクの未使用部分または未割り当て部分で発生した破損をシステムが検出できないことがあります。ファイルシステムの整合性チェックは通常どおりに実行する必要がありますが、この手順は必要時(電源喪失時など)に大きなファイルシステムで障害ボリュームを検出する場合にのみ実行してください。
注:この手順は、手動手順(ディスクの追加や再接続、ノードの停止、ノードの開始、リブートなど)を実行する前に完了しておく必要があります。そうしないと、reformat_storage_block_devices.rbスクリプトを実行した(次の障害ストレージ ボリュームのリカバリとCassandraデータベースの再構築の手順の一部)ときに、ファイルシステム エラーが発生してスクリプトがハングしたり失敗したりする場合があります。
注:rebootコマンドを実行する前に、ハードウェアを修理してディスクを適切に接続してください。
注意:
障害ストレージ ボリュームを特定する際には注意が必要です。この情報を使用して、再フォーマットが必要なボリュームを確認します。ボリュームを再フォーマットすると、そのボリュームのデータはリカバリできません。

障害が発生したストレージ ボリュームを正しくリカバリするためには、そのストレージ ボリュームのデバイス名とIDの両方を把握しておく必要があります。

インストール時に、各ストレージ デバイスにはファイルシステムのUniversal Unique Identifier(UUID)が割り当てられ、そのUUIDを使用してストレージ ノードのrangedbディレクトリにマウントされます。ファイルシステムのUUIDとrangedbディレクトリは、/etc/fstabファイルに記載されています。デバイス名、rangedbディレクトリ、およびマウントされたボリュームのサイズは、StorageGRID Webscaleシステムの[Grid] > [site] > [failed Storage Node] > [SSM] > [Resources] > [Overview] > [Main]に表示されます。

次の例では、ボリューム サイズが4TBのデバイス/dev/sdb/var/local/rangedb/0にマウントされており、/etc/fstabファイル内のデバイス名/dev/disk/by-uuid/822b0547-3b2b-472e-ad5e-e1cf1809fabaを使用しています。
ボリューム サイズの例

手順

  1. 次の手順を実行して、障害ストレージ ボリュームとそのデバイス名を記録します。
    1. [Grid]を選択します。
    2. [site] > [failed Storage Node] > [LDR] > [Storage] > [Overview] > [Main]を選択し、アラームが示されているオブジェクト ストアを探します。

      [Object Stores]セクション
    3. [site] > [failed Storage Node] > [SSM] > [Resources] > [Overview] > [Main]を選択します。前の手順で特定した各障害ストレージ ボリュームのマウント ポイントとボリューム サイズを確認します。
      たとえば、オブジェクト ストア0000はマウント ポイント/var/local/rangedb/0に対応しています。

      オブジェクト ストアとマウント ポイントを示す例

      オブジェクト ストアとマウント ポイントには、16進表記の番号(0000~000F)が付けられます。たとえば、IDが0000のオブジェクト ストアは、デバイス名がsdcでサイズが96.6GBの/var/local/rangedb/0に対応しています。

      障害ストレージ ボリュームのボリューム番号とデバイス名を確認できない場合は、同等のストレージ ノードにログインし、そのサーバでのボリュームとデバイス名のマッピングを確認します。

      通常ストレージ ノードは、同じハードウェアとストレージ構成を使用するペアで追加されます。同等のストレージ ノードで/etc/fstabファイルを調べて、各ストレージ ボリュームに対応するデバイス名を特定します。各障害ストレージ ボリュームのデバイス名を特定し、記録します。

  2. サービス ラップトップから、障害が発生したストレージ ノードにログインします。
    1. 次のコマンドを入力します:ssh admin@grid_node_IP
    2. Passwords.txtファイルに含まれているパスワードを入力します。
    3. 次のコマンドを入力してrootに切り替えます:su -
    4. Passwords.txtファイルに含まれているパスワードを入力します。
    rootとしてログインすると、プロンプトが$から#に変わります。
  3. LDRサービスを停止し、障害ストレージ ボリュームをアンマウントします。
    1. LDRサービスを停止します。service ldr stop
    2. rangedb 0をリカバリする必要がある場合は、rangedb 0をアンマウントする前にCassandraを停止します。service cassandra stop
    3. 障害ストレージ ボリュームをアンマウントします。umount /var/local/rangedb/object_store_ID

      object_store_IDは、障害ストレージ ボリュームのIDです。たとえば、IDが0000のオブジェクトには「0」を入力します。