ハードウェアアシストテイクオーバーの仕組み
デフォルトで有効になっているハードウェアアシストテイクオーバー機能を使用すると、ノードのリモート管理デバイス(サービスプロセッサ)を使用してテイクオーバー処理にかかる時間を短縮できます。
リモート管理デバイスは障害を検出すると、パートナーのハートビートが停止したことをONTAPが認識するのを待たずに、すぐにテイクオーバーを開始します。この機能を有効にせずに障害が発生した場合、パートナーはノードからハートビートが送信されなくなったことを認識するまで待機し、ハートビートが失われたことを確認してからテイクオーバーを開始します。
ハードウェアアシストテイクオーバー機能では、この待機時間を回避するために次のプロセスが使用されます。
-
リモート管理デバイスは、特定のタイプの障害についてローカルシステムを監視します。
-
障害が検出されると、リモート管理デバイスはすぐにパートナーノードにアラートを送信します。
-
アラートを受け取ったパートナーはテイクオーバーを開始します。
ハードウェアアシストテイクオーバーをトリガーするシステムイベント
リモート管理デバイス(サービスプロセッサ)から受信したアラートのタイプによっては、パートナーノードでテイクオーバーが生成されることがあります。
アラート |
テイクオーバーが開始されるか |
説明 |
abnormal_reboot |
いいえ |
ノードの異常リブートが発生しました。 |
l2_watchdog_reset |
〇 |
システムウォッチドッグハードウェアがL2リセットを検出しました。リモート管理デバイスでシステムCPUから応答がないことが検出され、システムがリセットされました。 |
ハートビート損失 |
いいえ |
リモート管理デバイスがノードからハートビートメッセージを受信しなくなりました。このアラートは、HAペアのノード間のハートビートメッセージではなく、ノードとローカルのリモート管理デバイス間のハートビートメッセージです。 |
定期的なメッセージ |
いいえ |
通常のハードウェアアシストテイクオーバー処理中は、定期的なメッセージが送信されます。 |
power_cycle_via_sp |
〇 |
リモート管理デバイスがシステムの電源を入れ直した。 |
パワーロス |
〇 |
ノードで電源喪失が発生しました。リモート管理デバイスには、電源喪失後も短時間電力を維持する電源装置が搭載されているため、パートナーに電力喪失を報告できます。 |
power_off_via_sp |
〇 |
リモート管理デバイスの電源がオフになっている。 |
reset_via_sp |
〇 |
リモート管理デバイスによってシステムがリセットされました。 |
テスト |
いいえ |
ハードウェアアシストテイクオーバー処理を確認するために送信されるテストメッセージです。 |