Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

硬件辅助接管的工作原理

贡献者

默认情况下,硬件辅助接管功能可通过使用节点的远程管理设备(服务处理器)来加快接管过程。

当远程管理设备检测到故障时,它会快速启动接管,而不是等待 ONTAP 识别配对设备的检测信号已停止。如果在未启用此功能的情况下发生故障,配对节点将一直等待,直到发现节点不再发出检测信号,确认检测信号丢失,然后启动接管。

硬件辅助接管功能使用以下过程来避免等待:

  1. 远程管理设备可监控本地系统是否存在某些类型的故障。

  2. 如果检测到故障,远程管理设备会立即向配对节点发送警报。

  3. 收到警报后,配对节点将启动接管。

触发硬件辅助接管的系统事件

配对节点可能会根据从远程管理设备(服务处理器)收到的警报类型生成接管。

警报

收到后是否启动接管?

Description

异常重新启动

节点异常重新启动。

l2_watchdog 重置

是的。

系统 watchdog 硬件检测到 L2 重置。
远程管理设备检测到系统 CPU 无响应并重置系统。

丢失检测信号

远程管理设备不再从节点接收检测信号消息。
此警报不是指 HA 对中节点之间的检测信号消息,而是指节点与其本地远程管理设备之间的检测信号。

PERIODIC_MESSAGE

在正常的硬件辅助接管操作期间,系统会定期发送一条消息。

power_cycle_via_sp

是的。

远程管理设备已重新启动系统。

power_loss

是的。

节点断电。
远程管理设备具有一个电源,可在断电后短时间内保持供电,从而可以向配对设备报告断电情况。

power_off_via_sp

是的。

远程管理设备已关闭系统。

reset_via_sp

是的。

远程管理设备将重置系统。

测试

此时将发送一条测试消息、以验证硬件辅助接管操作。