切断されているグリッド ノードの運用停止

現在グリッドに接続されていないノード([Health]列が「Unknown」または「Administratively Down」になっているノード)の運用停止が必要な場合があります。

開始する前に

タスク概要

切断されているノードは、[Health]列にUnknown(青)アイコンまたはAdministratively Down(グレー)アイコンが表示されます。次の例では、ストレージ ノードDC1-S4が切断されており、他のすべてのノードは接続されています。


切断されたノードが1つある[Decommission Nodes]ページ
切断されているノードの運用を停止する前に、次の点を確認してください。
  • この手順は主に、切断されているノードを1つ削除することを目的としています。グリッド内に切断されているノードが複数ある場合は、それらをすべて同時に運用停止する必要があるため、予期しない結果になる可能性があります。
    注意: 切断されている複数のグリッド ノード、特に複数のストレージ ノードの運用を停止する場合は、特に注意が必要です。
  • 削除できない切断されているノードがある場合(たとえば、ADCクォーラムに必要なストレージ ノード)、切断されている他のノードを削除できません。
切断されているストレージ ノードの運用を停止する前に、次の点を確認してください。
  • 切断されているストレージ ノードの運用停止は、オンラインに戻したりリカバリしたりすることができなくても問題がない場合にのみ実行してください。
    注意: ノードからオブジェクト データをリカバリできる可能性がある場合は、この手順を実行しないでください。その代わりに、テクニカル サポートに問い合わせて、ノードのリカバリが可能かどうかを確認してください。
  • 切断されている複数のストレージ ノードを運用停止すると、データが失われる可能性があります。十分な数のオブジェクト コピー、イレイジャー コーディング フラグメント、またはオブジェクト メタデータが残っていないと、システムがデータを再構築できない場合があります。
    注意: 切断されていてリカバリできない複数のストレージ ノードがある場合は、テクニカル サポートに問い合わせて、最適な対処方法を確認してください。
  • 切断されているストレージ ノードの運用を停止すると、StorageGRIDは運用停止手順の最後にデータ修復ジョブを開始します。これらのジョブは、切断されているノードに格納されていたオブジェクト データとメタデータの再構築を試みます。
  • 切断されているストレージ ノードの運用を停止する場合、運用停止手順は比較的短時間で完了します。ただし、データ修復ジョブは実行に数日から数週間かかることがあり、運用停止手順によって監視されません。これらのジョブは手動で監視し、必要に応じて再開してください。
  • 切断されており、特定のオブジェクトの唯一のコピーが格納されたストレージ ノードの運用を停止すると、そのオブジェクトは失われます。データ修復ジョブは、現在接続されているストレージ ノードに、1つ以上のレプリケート コピーまたは十分なイレイジャー コーディング フラグメントが含まれている場合のみ、オブジェクトを再構築してリカバリできます。
切断されている管理ノードまたはゲートウェイ ノードの運用を停止する前に、次の点を確認してください。
注意: 手順で指示されるまでは、グリッド ノードの仮想マシンやその他のリソースを削除しないでください。

手順

  1. 切断されているグリッド ノードのオンラインへの復帰またはリカバリを試行します。
    手順については、リカバリ手順を参照してください。
  2. 切断されているグリッド ノードをリカバリできず、そのノードを切断状態のまま運用を停止する場合は、そのノードのチェック ボックスをオンにします。
    注: グリッド内に切断されているノードが複数ある場合は、それらをすべて同時に運用停止する必要があるため、予期しない結果になる可能性があります。
    注意: 切断されている複数のグリッド ノード、特に複数のストレージ ノードの運用を停止する場合は、特に注意が必要です。切断されていてリカバリできない複数のストレージ ノードがある場合は、テクニカル サポートに問い合わせて、最適な対処方法を確認してください。
  3. プロビジョニング パスフレーズを入力します。
    [Start Decommission]ボタンが有効になります。
  4. [Start Decommission]をクリックします。
    切断されているノードが選択されていることと、そのノードに特定のオブジェクトの唯一のコピーが含まれている場合はオブジェクト データが失われることを示す警告が表示されます。

    運用停止の警告メッセージのスクリーンショット
  5. ノードのリストを確認して、[OK]をクリックします。
    運用停止手順が開始され、ノードごとの進行状況が表示されます。手順の実行中、グリッドの設定変更を反映するために、新しいリカバリ パッケージが生成されます。

    進行中のノードの運用停止のスクリーンショット
  6. 新しいリカバリ パッケージが生成されたら、リンクをクリックするか、[Maintenance] > [Recovery Package]を選択して[Recovery Package]ページにアクセスします。次に、.zipファイルをダウンロードします。
    リカバリ パッケージのダウンロード手順を参照してください。
    注: 運用停止手順で問題が発生した場合にグリッドをリカバリできるよう、できるだけ早くリカバリ パッケージをダウンロードしてください。
  7. 選択したすべてのノードが正常に運用を停止されたことを確認するために、[Decommission]ページを定期的に監視します。
    ストレージ ノードの運用停止には、数日から数週間かかることがあります。すべてのタスクが完了したら、成功のメッセージとともに選択したノードのリストが再表示されます。切断されているストレージ ノードの運用を停止した場合は、修復ジョブが開始されたことを示す情報メッセージが表示されます。

    修復ジョブが開始されたことを示すメッセージのスクリーンショット
  8. 運用停止したノードに関連付けられている残りの仮想マシンやその他のリソースを削除します。
  9. ストレージ ノードの運用を停止している場合は、運用停止プロセス中に自動的に開始されるデータ修復ジョブのステータスを監視します。
    1. [Support]を選択します。次に、メニューの[Tools]セクションで[Grid Topology]を選択します。
    2. グリッド トポロジ ツリーの最上部にある[StorageGRID deployment]を選択します。
    3. [Overview]タブで[ILM Activity]セクションを確認します。
    4. 次の属性を確認し、レプリケート データの修復が完了したかどうかを可能なかぎり判断します。
      注: Cassandraに不整合が生じている可能性があり、また、失敗した修復は追跡されません。
      • Repairs Attempted (XRPA):この属性を使用して、レプリケート データの修復の進行状況を追跡します。この属性は、ストレージ ノードがハイリスク オブジェクトの修復を試みるたびに値が増分します。この属性の値が現在のスキャン期間([Scan Period – Estimated]属性で確認可能)よりも長い期間増えないときは、ILMスキャンで修復を必要とするハイリスク オブジェクトがどのノードにも見つからなかったことを意味します。
        注: ハイリスク オブジェクトとは、完全に失われる危険があるオブジェクトです。ILM設定を満たしていないオブジェクトは含まれません。
      • Scan Period – Estimated (XSCM):この属性を使用して、以前に取り込まれたオブジェクトにいつポリシー変更が適用されるかを推定します。[Repairs Attempted]属性の値が現在のスキャン期間よりも長い期間増えない場合は、レプリケート データの修復が完了している可能性があります。スキャン期間は変わる可能性があるので注意してください。[Scan Period – Estimated (XSCM)]属性はすべてのノード スキャン期間の最大値で、グリッド全体に適用されます。グリッドの[Scan Period – Estimated]属性の履歴を照会して、適切な期間を特定することができます。
    5. 次のコマンドを使用して、修復を追跡または再開します。
      • repair-data show-ec-repair-statusコマンドを使用して、イレイジャー コーディング データの修復を追跡します。
      • repair-data start-ec-node-repairコマンドに--repair-idオプションを指定して実行し、失敗した修復を再開します。
      データ修復ジョブの確認手順を参照してください。
  10. 修復ジョブがすべて正常に完了するまで、引き続きECデータの修復のステータスを追跡します。
    切断されているノードが運用停止され、すべてのデータ修復ジョブが完了したら、必要に応じて、接続されているグリッド ノードの運用を停止できます。

終了後の操作

運用停止手順が完了したら、次の手順を実行します。