简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。
硬件辅助接管的工作原理
贡献者
建议更改
默认情况下,硬件辅助接管功能可通过使用节点的远程管理设备(服务处理器)来加快接管过程。
当远程管理设备检测到故障时,它会快速启动接管,而不是等待 ONTAP 识别配对设备的检测信号已停止。如果在未启用此功能的情况下发生故障,配对节点将一直等待,直到发现节点不再发出检测信号,确认检测信号丢失,然后启动接管。
硬件辅助接管功能使用以下过程来避免等待:
-
远程管理设备可监控本地系统是否存在某些类型的故障。
-
如果检测到故障,远程管理设备会立即向配对节点发送警报。
-
收到警报后,配对节点将启动接管。
触发硬件辅助接管的系统事件
配对节点可能会根据从远程管理设备(服务处理器)收到的警报类型生成接管。
警报 |
收到后是否启动接管? |
Description |
异常重新启动 |
否 |
节点异常重新启动。 |
l2_watchdog 重置 |
是的。 |
系统 watchdog 硬件检测到 L2 重置。 |
丢失检测信号 |
否 |
远程管理设备不再从节点接收检测信号消息。 |
PERIODIC_MESSAGE |
否 |
在正常的硬件辅助接管操作期间,系统会定期发送一条消息。 |
power_cycle_via_sp |
是的。 |
远程管理设备已重新启动系统。 |
power_loss |
是的。 |
节点断电。 |
power_off_via_sp |
是的。 |
远程管理设备已关闭系统。 |
reset_via_sp |
是的。 |
远程管理设备将重置系统。 |
测试 |
否 |
此时将发送一条测试消息、以验证硬件辅助接管操作。 |