分離されているノードのネットワーク接続のリストア

サイトまたはグリッド全体のIPアドレスの変更など、特定の状況では、ノードの一部のグループがグリッド内の他のノードと通信できない場合があります。

タスク概要

Grid Managerで、ノードがグレーになっているか、青くても多数のサービスのステータスが[Running]以外になっている場合は、ノードが分離されていないかチェックする必要があります。


スクリーンショット

分離されているノードがあると、主に以下のような事態を招きます。
  • 複数のノードが分離されていると、Grid Managerへのサインインやアクセスができなくなる場合があります。
  • 複数のノードが分離されていると、Tenant Managerのダッシュボードに表示される[Storage Usage]と[Quota]の値が最新ではない場合があります。合計値はネットワーク接続が回復すると更新されます。

分離の問題を解決するには、グリッドから分離されている各ノードまたはグループ内の1つのノードで、コマンド ライン ユーティリティを実行します。このユーティリティは、これらのノードに、グリッド内の分離されていないノードのIPアドレスを提供します。これにより、分離されているノードまたはノードのグループがグリッド全体と再度通信できるようになります。

手順

  1. ノードにアクセスし、/var/local/log/dynip.logで分離に関するメッセージを確認します。
     [2018-01-09T19:11:00.545] UpdateQueue - WARNING -- Possible isolation, no contact with other nodes. 
    If this warning persists, manual action may be required.

    VMwareコンソールを使用している場合は、ノードが分離された可能性があることを示すメッセージが含まれます。

    Linux環境では、分離に関するメッセージは/var/log/storagegrid/node/<nodename>.logファイルに表示されます。

  2. 分離に関するメッセージが繰り返し表示され、なくならない場合は、次のコマンドを実行します。
    add_node_ip.py <address>

    <address>は、グリッドに接続されているリモート ノードのIPアドレスです。

    # /usr/sbin/add_node_ip.py  10.224.4.210
    
    Retrieving local host information
    Validating remote node at address 10.224.4.210
    Sending node IP hint for 10.224.4.210 to local node
    Local node found on remote node. Update complete.
    
  3. 分離されていた各ノードで、次の点を確認します。
    • ノードのサービスが開始されている。
    • storagegrid-statusコマンドを実行したあとに、動的IPサービスのステータスが「Running」になっている。
    • グリッド トポロジ ツリーで、ノードがグリッド内の他のノードから切断されていない状態になっている。
    注意:add_node_ip.pyコマンドを実行しても問題を解決できなかった場合は、解決が必要な別の問題がネットワークに発生している可能性があります。