HAペアの管理の概要
クラスタノードは、フォールトトレランスとノンストップオペレーションを実現するためにハイアベイラビリティ(HA)ペアで構成されます。ノードに障害が発生した場合や定期的なメンテナンスのためにノードを停止する必要がある場合は、パートナーがストレージをテイクオーバーしてデータの提供を継続できます。ノードがオンラインに戻ったら、パートナーはストレージをギブバックします。
HAペアコントローラ構成は、対応するFAS / AFFストレージコントローラ(ローカルノードとパートナーノード)のペアで構成されます。これらの各ノードは、もう一方のディスクシェルフに接続されます。HAペアの一方のノードでエラーが発生してデータの処理が停止すると、障害が発生したパートナーのステータスが検出され、そのコントローラからすべてのData Processingがテイクオーバーされます。
_Takeover は、ノードがパートナーのストレージの制御を引き継ぐプロセスです。
giveback は、ストレージがパートナーに返されるプロセスです。
デフォルトでは、次のいずれかの状況で自動的にテイクオーバーが実行されます。
-
ノードでソフトウェアまたはシステムの障害が発生し、パニックが発生した場合。HAペアコントローラは、対応するパートナーノードに自動的にフェイルオーバーされます。パートナーがパニック状態から回復してブートされると、ノードで自動的にギブバックが実行され、パートナーは通常動作に戻ります。
-
ノードでシステム障害が発生し、そのノードをリブートできない。たとえば、停電が原因でノードに障害が発生した場合、HAペアコントローラがパートナーノードに自動的にフェイルオーバーされ、稼働しているストレージコントローラからデータが提供されます。
ノードのストレージへの電源も同時に喪失した場合は、標準テイクオーバーは実行できません。 |
-
ノードのパートナーからハートビート メッセージが届かない場合。この状況は、パートナーでハードウェアまたはソフトウェア障害(インターコネクト障害など)が発生し、パニック状態にはならなかったものの、正常に機能しなくなった場合に発生します。
-
パラメータまたは
-inhibit-takeover true`パラメータを使用せずに一方のノードを停止した場合 `-f
クラスタHAが有効な2ノードクラスタで、パラメータを使用してノードを停止またはリブート `‑inhibit‑takeover true`すると、クラスタHAを無効にしてからオンラインのままにするノードにイプシロンを割り当てないかぎり、両方のノードでデータの提供が停止します。 |
-
パラメータを使用せずに一方のノードをリブートした場合
‑inhibit‑takeover true
( `‑onboot`コマンドのパラメータは `storage failover`デフォルトで有効になっています)。 -
リモート管理デバイス(サービスプロセッサ)でパートナーノードの障害が検出された場合。これは、ハードウェアアシストテイクオーバーを無効にした場合は該当しません。
コマンドを使用してテイクオーバーを手動で開始することもできます storage failover takeover
。
クラスタの耐障害性と診断の強化
ONTAP 9.9.1以降では、耐障害性と診断機能が次のように追加され、クラスタの運用が改善されています。
-
ポートの監視と回避:2ノードスイッチレスクラスタ構成では、全体的なパケット損失(接続の損失)が発生するポートを回避します。ONTAP 9 8.1以前では、この機能はスイッチ経由の構成でのみ使用できました。
-
ノードの自動フェイルオーバー:クラスタネットワーク経由でデータを提供できないノードは、ディスクを所有しないでください。代わりに、パートナーが正常に稼働している場合は、そのHAパートナーがテイクオーバーします。
-
接続の問題を分析するコマンド:次のコマンドを使用して、パケット損失が発生しているクラスタパスを表示します。
network interface check cluster-connectivity show