Obtenga más información sobre la gestión de pares de alta disponibilidad en clústeres de ONTAP
Los nodos del clúster están configurados en pares de alta disponibilidad (HA) para tolerancia a fallos y operaciones sin interrupciones. Si un nodo falla o si necesita desconectar un nodo para realizar un mantenimiento rutinario, su socio puede hacerse cargo de su almacenamiento y continuar sirviendo datos desde él. El socio devuelve el almacenamiento cuando el nodo vuelve a estar en línea.
La configuración del controlador de par HA consiste en un par de controladores de almacenamiento coincidentes (nodo local y nodo asociado). Cada uno de estos nodos está conectado a las bandejas de discos de los demás. Cuando un nodo de un par HA encuentra un error y deja de procesar datos, su compañero detecta el estado de fallo del compañero y asume todo el procesamiento de datos de ese controlador.
Takeover es el proceso en el que un nodo asume el control sobre el almacenamiento de su partner.
Giveback es el proceso en el que el almacenamiento se devuelve al partner.
De forma predeterminada, las adquisiciones se realizan automáticamente en cualquiera de las siguientes situaciones:
-
Se produce un fallo del sistema o software en un nodo que provoca una caída en alarma. Las controladoras de parejas de alta disponibilidad conmutan automáticamente al nodo de su partner. Una vez que el partner se ha recuperado de la alarma y se ha iniciado, el nodo realiza automáticamente una devolución, devolviendo al partner al funcionamiento normal.
-
Se produce un fallo del sistema en un nodo y el nodo no se puede reiniciar. Por ejemplo, cuando un nodo falla debido a una pérdida de alimentación, las controladoras de parejas de alta disponibilidad conmuta automáticamente a su nodo de partner y sirven los datos de la controladora de almacenamiento superviviente.
|
|
Si el almacenamiento para un nodo también pierde potencia al mismo tiempo, no será posible una toma de control estándar. |
-
No se reciben mensajes de latido del compañero del nodo. Esto podría suceder si el partner experimentó un error de hardware o software (por ejemplo, un fallo de interconexión) que no dio lugar a una situación de pánico, pero todavía impidió que funcionara correctamente.
-
Detenga uno de los nodos sin usar
-f-inhibit-takeover trueel parámetro o.
|
|
En un clúster de dos nodos con la alta disponibilidad de clúster habilitada, la detención o el reinicio de un nodo mediante ‑inhibit‑takeover true el parámetro provoca que ambos nodos dejen de servir datos a menos que primero deshabilite la alta disponibilidad del clúster y, a continuación, asigne épsilon al nodo que desea permanecer online.
|
-
Se reinicia uno de los nodos sin utilizar
‑inhibit‑takeover trueel parámetro. (‑onboot`El parámetro del `storage failovercomando está habilitado de manera predeterminada). -
El dispositivo de gestión remota (Service Processor) detecta un fallo del nodo asociado. Esto no es aplicable si deshabilita la toma de control asistida por hardware.
También puede iniciar manualmente las tomas de control con storage failover takeover el comando.
A partir de ONTAP 9.18.1, puede configurar la comunicación cifrada entre nodos de pares HA. Para obtener más información, consulte"Configure el cifrado para el tráfico de alta disponibilidad de ONTAP." .
Mejoras en la resiliencia y el diagnóstico de clústeres
A partir de ONTAP 9,9.1, las siguientes adiciones de resiliencia y diagnóstico mejoran el funcionamiento del clúster:
-
Monitoreo y evitación de puertos: En configuraciones de clúster conmutado de dos nodos, el sistema evita los puertos que experimentan pérdida total de paquetes (pérdida de conectividad). En ONTAP 9.8.1 y versiones anteriores, esta funcionalidad solo estaba disponible en configuraciones conmutadas.
-
* Failover automático de nodos*: Si un nodo no puede servir datos a través de su red de clúster, ese nodo no debe poseer ningún disco. En lugar de eso, su partner de alta disponibilidad debería asumir el control si el partner está en buen estado.
-
Comandos para analizar problemas de conectividad: Utilice el siguiente comando para mostrar qué rutas de cluster están experimentando pérdida de paquetes:
network interface check cluster-connectivity showObtenga más información sobre
network interface check cluster-connectivity showen el "Referencia de comandos del ONTAP".