ONTAP Select HAはデータ保護を強化します
高可用性(HA)ディスクハートビート、HAメールボックス、HAハートビート、HAフェイルオーバー、およびギブバックは、データ保護を強化するために機能します。
ディスクハートビート
ONTAP Select HAアーキテクチャは、従来のFASアレイで使用されている多くのコードパスを活用していますが、いくつかの例外があります。これらの例外の1つは、ディスクベースのハートビートの実装です。これは、ネットワークの分離によってスプリットブレイン動作が発生するのを防ぐためにクラスタノードが使用する、ネットワークベースではない通信方法です。スプリットブレインシナリオは、通常ネットワーク障害によって引き起こされるクラスタのパーティショニングの結果であり、各側が相手側がダウンしていると判断し、クラスタリソースの引き継ぎを試みます。
エンタープライズクラスのHA実装は、このようなシナリオに適切に対応できなければならない。ONTAPは、カスタマイズされたディスクベースのハートビート方式によってこれを実現します。これはHAメールボックスの役割であり、クラスタノードがハートビートメッセージを送信するために使用する物理ストレージ上の場所です。これは、クラスターが接続性を判断し、フェイルオーバー発生時のクォーラムを定義するのに役立ちます。
共有ストレージHAアーキテクチャを使用するFASアレイでは、ONTAPは以下の方法でスプリットブレインの問題を解決します:
-
SCSIの永続的予約
-
永続的なHAメタデータ
-
HAインターコネクト経由で送信されるHA状態
ただし、ONTAP Selectクラスタのシェアードナッシングアーキテクチャでは、ノードは自身のローカルストレージのみを参照でき、HAパートナーのストレージは参照できません。したがって、ネットワーク分割によってHAペアの両側が分離される場合、クラスタクォーラムとフェイルオーバー動作を決定するための前述の方法は利用できなくなります。
既存の脳分離検出・回避方法は使用できないものの、共有なし環境の制約に適合する仲介方法が依然として必要である。ONTAP Selectは既存のメールボックスインフラストラクチャをさらに拡張し、ネットワーク分断が発生した場合の仲介手段として機能できるようにする。共有ストレージが利用できないため、仲介はNAS経由でメールボックスディスクにアクセスすることによって行われます。これらのディスクは、2ノードクラスタのメディエーターを含め、iSCSIプロトコルを使用してクラスター全体に分散されています。したがって、クラスタノードはこれらのディスクへのアクセスに基づいて、インテリジェントなフェイルオーバーの判断を下すことができる。ノードがHAパートナー以外のノードのメールボックスディスクにアクセスできる場合、そのノードは正常に稼働している可能性が高い。
|
|
メールボックスアーキテクチャと、クラスタクォーラムとスプリットブレインの問題を解決するディスクベースのハートビート方式は、マルチノードバリアントのONTAP Selectで4つの独立したノードまたは2ノードクラスタ用のメディエーターのいずれかが必要な理由です。 |
HAメールボックスポスティング
HAメールボックスアーキテクチャは、メッセージポストモデルを使用します。クラスタノードは、一定間隔で、ノードが稼働中であることを示すメッセージを、メディエーターを含むクラスタ内のすべての他のメールボックスディスクに投稿します。正常なクラスタ内では、どの時点においても、クラスタノード上の単一のメールボックスディスクに、他のすべてのクラスタノードから送信されたメッセージが保存されています。
各Selectクラスタノードには、共有メールボックスへのアクセス専用の仮想ディスクが接続されています。このディスクは、ノード障害やネットワーク分断が発生した場合にクラスタの仲介手段として機能することを主な機能としているため、メディエーターメールボックスディスクと呼ばれています。このメールボックスディスクには、各クラスタノード用のパーティションが含まれており、他のSelectクラスタノードによってiSCSIネットワーク経由でマウントされます。これらのノードは定期的に、メールボックスディスクの適切なパーティションにヘルスステータスを送信します。クラスタ全体に分散配置されたネットワークアクセス可能なメールボックスディスクを使用することで、到達可能性マトリックスを通じてノードの状態を推測できます。例えば、クラスタノードAとBはクラスタノードDのメールボックスには投稿できますが、ノードCのメールボックスには投稿できません。さらに、クラスタノードDはノードCのメールボックスに投稿できないため、ノードCはダウンしているかネットワークから隔離されている可能性が高く、引き継ぐ必要があります。
HAハートビート
NetApp FASプラットフォームと同様に、ONTAP SelectはHAインターコネクトを介してHAハートビートメッセージを定期的に送信します。ONTAP Selectクラスタ内では、これはHAパートナー間に存在するTCP/IPネットワーク接続を介して実行されます。さらに、ディスクベースのハートビートメッセージは、メディエーターメールボックスディスクを含む、すべてのHAメールボックスディスクに送信されます。これらのメッセージは数秒ごとに送信され、定期的に読み戻されます。これらの送受信頻度により、ONTAP SelectクラスタはFASプラットフォームで使用可能なものと同じ時間枠である約15秒以内にHA障害イベントを検出できます。ハートビートメッセージが読み取れなくなると、フェイルオーバーイベントがトリガーされます。
次の図は、単一のONTAP Selectクラスタノード(ノードC)の視点から、HAインターコネクトおよびメディエーターディスクを介してハートビートメッセージを送受信するプロセスを示しています。
|
|
ネットワークハートビートは、HAインターコネクトを介してHAパートナーであるノードDに送信され、ディスクハートビートはクラスタノードA、B、C、およびDのすべてのメールボックスディスクを使用します。 |
4ノードクラスタにおけるHAハートビート:定常状態 
HAのフェイルオーバーとギブバック
フェイルオーバー操作中、生存ノードは、HAパートナーのデータのローカルコピーを使用して、ピアノードのデータ提供責任を引き継ぎます。クライアントI/Oは中断なく継続できますが、データへの変更は、ギブバックが行われる前にレプリケートされる必要があります。ONTAP Selectは強制的なギブバックをサポートしていません。強制的なギブバックを行うと、生存ノードに保存されている変更が失われるためです。
同期バック処理は、リブートしたノードがクラスタに再参加すると自動的にトリガーされます。同期バックに必要な時間は、いくつかの要因によって異なります。これらの要因には、レプリケートする必要がある変更の数、ノード間のネットワークレイテンシ、および各ノードのディスクサブシステムの速度が含まれます。同期バックに必要な時間が、自動ギブバックウィンドウの10分を超える可能性があります。この場合、同期バック後に手動でのギブバックが必要です。同期バックの進捗状況は、次のコマンドを使用して監視できます:
storage aggregate status -r -aggregate <aggregate name>