Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

HAペアの管理の概要

共同作成者

クラスタノードは、フォールトトレランスとノンストップオペレーションを実現するためにハイアベイラビリティ(HA)ペアで構成されます。ノードに障害が発生した場合や定期的なメンテナンスのためにノードを停止する必要がある場合は、パートナーがストレージをテイクオーバーしてデータの提供を継続できます。ノードがオンラインに戻ったら、パートナーはストレージをギブバックします。

HAペアコントローラ構成は、対応するFAS / AFFストレージコントローラ(ローカルノードとパートナーノード)のペアで構成されます。これらの各ノードは、もう一方のディスクシェルフに接続されます。HAペアの一方のノードでエラーが発生してデータの処理が停止すると、障害が発生したパートナーのステータスが検出され、そのコントローラからすべてのData Processingがテイクオーバーされます。

_Takeover は、ノードがパートナーのストレージの制御を引き継ぐプロセスです。

giveback は、ストレージがパートナーに返されるプロセスです。

デフォルトでは、次のいずれかの状況で自動的にテイクオーバーが実行されます。

  • ノードでソフトウェアまたはシステムの障害が発生し、パニックが発生した場合。HAペアコントローラは、対応するパートナーノードに自動的にフェイルオーバーされます。パートナーがパニック状態から回復してブートされると、ノードで自動的にギブバックが実行され、パートナーは通常動作に戻ります。

  • ノードでシステム障害が発生し、そのノードをリブートできない。たとえば、停電が原因でノードに障害が発生した場合、HAペアコントローラがパートナーノードに自動的にフェイルオーバーされ、稼働しているストレージコントローラからデータが提供されます。

メモ ノードのストレージへの電源も同時に喪失した場合は、標準テイクオーバーは実行できません。
  • ノードのパートナーからハートビート メッセージが届かない場合。この状況は、パートナーでハードウェアまたはソフトウェア障害(インターコネクト障害など)が発生し、パニック状態にはならなかったものの、正常に機能しなくなった場合に発生します。

  • パラメータまたは -inhibit-takeover true`パラメータを使用せずに一方のノードを停止した場合 `-f

メモ クラスタHAが有効な2ノードクラスタで、パラメータを使用してノードを停止またはリブート `‑inhibit‑takeover true`すると、クラスタHAを無効にしてからオンラインのままにするノードにイプシロンを割り当てないかぎり、両方のノードでデータの提供が停止します。
  • パラメータを使用せずに一方のノードをリブートした場合 ‑inhibit‑takeover true( `‑onboot`コマンドのパラメータは `storage failover`デフォルトで有効になっています)。

  • リモート管理デバイス(サービスプロセッサ)でパートナーノードの障害が検出された場合。これは、ハードウェアアシストテイクオーバーを無効にした場合は該当しません。

コマンドを使用してテイクオーバーを手動で開始することもできます storage failover takeover

クラスタの耐障害性と診断の強化

ONTAP 9.9.1以降では、耐障害性と診断機能が次のように追加され、クラスタの運用が改善されています。

  • ポートの監視と回避:2ノードスイッチレスクラスタ構成では、全体的なパケット損失(接続の損失)が発生するポートを回避します。ONTAP 9 8.1以前では、この機能はスイッチ経由の構成でのみ使用できました。

  • ノードの自動フェイルオーバー:クラスタネットワーク経由でデータを提供できないノードは、ディスクを所有しないでください。代わりに、パートナーが正常に稼働している場合は、そのHAパートナーがテイクオーバーします。

  • 接続の問題を分析するコマンド:次のコマンドを使用して、パケット損失が発生しているクラスタパスを表示します。 network interface check cluster-connectivity show