グリッド ノードのリストアと検証

障害グリッド ノードのグリッド構成ファイルをリストアして検証し、エラーをすべて解決する必要があります。

タスク概要

元のホストの障害によって /var/localボリュームが失われていないかぎり、ホストに必要なグリッド ノードをインポートできます。たとえば、使用しているLinuxオペレーティング システムでのStorageGRID Webscaleのインストール手順に従って、StorageGRID Webscaleシステムのメタデータ ボリュームに共有ストレージを使用していた場合は、/var/localボリュームが残っている可能性があります。ノードをインポートすると、ノード構成ファイルがホストにリストアされます。

ノードをインポートできない場合は、グリッド構成ファイルを再作成する必要があります。

次に、StorageGRID Webscaleの再起動に進む前に、グリッド構成ファイルを検証し、予想されるネットワークまたはストレージの問題を解決する必要があります。

ノードの/var/localボリュームの場所の詳細については、インストール手順を参照してください。

手順

  1. リカバリしたホストのコマンドラインで、現在設定されているすべてのStorageGRID Webscaleグリッド ノードを一覧表示します。sudo storagegrid node list

    グリッド ノードが1つも設定されていない場合、出力は表示されません。グリッド ノードが設定されている場合は、次の形式で出力が表示されます。

    Name            Metadata-Volume
    ================================================================
    dc1-adm1           /dev/mapper/sgws-adm1-var-local
    dc1-gw1            /dev/mapper/sgws-gw1-var-local
    dc1-sn1            /dev/mapper/sgws-sn1-var-local
    dc1-arc1           /dev/mapper/sgws-arc1-var-local

    ホストで設定する必要のある一部またはすべてのグリッド ノードが表示されない場合は、そのグリッド ノードをリストアする必要があります。

  2. /var/localボリュームを含むグリッド ノードをインポートするには、次の手順を実行します。
    1. インポートする各ノードに対して次のコマンドを実行します。sudo storagegrid node import node-var-local-volume-path

      storagegrid node importコマンドが成功するのは、対象のノードが最後に実行されたホストでクリーン シャットダウンされている場合のみです。そうでない場合は、次のようなエラーが表示されます。

      This node (node-name) appears to be owned by another host (UUID host-uuid).
      
      Use the --force flag if you are sure import is safe.
      
    2. 別のホストが所有するノードに関するエラーが表示された場合は、--forceフラグを指定してコマンドをもう一度実行し、インポートを完了します。sudo storagegrid --force node import node-var-local-volume-path
      注:--forceフラグを指定してインポートされたノードがグリッドに再参加できるようになるには、「その他のリカバリ手順の実行(必要な場合)」に記載された追加のリカバリ手順が必要です。
  3. /var/localボリュームがないグリッド ノードについて、ノードの構成ファイルを再作成してホストにリストアします。

    インストール手順の「ノード構成ファイルの作成」のガイドラインに従ってください。

    注意:ノードの構成ファイルを再作成するときは、可能な場合は元のノードと同じネットワーク インターフェイス、ブロック デバイスのマッピング、およびIPアドレスを使用します。こうすることでリカバリ中にノードにコピーしなければならないデータ量を最小限に抑えることができ、リカバリにかかる時間を大幅に(場合によっては、数週間から数分に)短縮できます。
    注意:ノードの構成ファイルを再作成するときに、新しいブロック デバイス(StorageGRID Webscaleノードで以前に使用していなかったデバイス)を、BLOCK_DEVICE_で始まる設定変数の値として使用する場合は、「ブロック デバイスが見つからないエラーの修正」に記載されているすべてのガイドラインに従ってください。
  4. リカバリしたホストで次のコマンドを実行して、すべてのStorageGRID Webscaleノードを一覧表示します。
    sudo storagegrid node list
  5. storagegrid node listの出力に表示されている各グリッド ノードのノード構成ファイルを検証します。
    sudo storagegrid node validate node-name

    StorageGRID Webscaleホスト サービスを開始する前に、すべてのエラーまたは警告に対処する必要があります。以下のセクションでは、リカバリ時に特に問題となるエラーについて詳しく説明しています。