Obtenga más información sobre la gestión de pares de alta disponibilidad en clústeres de ONTAP
Los nodos de clúster están configurados en pares de alta disponibilidad para tolerancia a fallos y operaciones no disruptivas. Si un nodo falla o si necesita desconectar un nodo para realizar un mantenimiento rutinario, su partner puede tomar el control de su almacenamiento y seguir sirviendo datos. El partner devuelve el almacenamiento cuando el nodo vuelve a estar online.
La configuración de controladoras de parejas de alta disponibilidad consta de un par de controladoras de almacenamiento FAS/AFF coincidentes (nodo local y nodo asociado). Cada uno de estos nodos está conectado a las bandejas de discos del otro. Cuando uno de los nodos de una pareja de alta disponibilidad encuentra un error y detiene el procesamiento de datos, su compañero detecta el estado fallido del partner y asume todo el procesamiento de los datos de esa controladora.
Takeover es el proceso en el que un nodo asume el control sobre el almacenamiento de su partner.
Giveback es el proceso en el que el almacenamiento se devuelve al partner.
De forma predeterminada, las adquisiciones se realizan automáticamente en cualquiera de las siguientes situaciones:
-
Se produce un fallo del sistema o software en un nodo que provoca una caída en alarma. Las controladoras de parejas de alta disponibilidad conmutan automáticamente al nodo de su partner. Una vez que el partner se ha recuperado de la alarma y se ha iniciado, el nodo realiza automáticamente una devolución, devolviendo al partner al funcionamiento normal.
-
Se produce un fallo del sistema en un nodo y el nodo no se puede reiniciar. Por ejemplo, cuando un nodo falla debido a una pérdida de alimentación, las controladoras de parejas de alta disponibilidad conmuta automáticamente a su nodo de partner y sirven los datos de la controladora de almacenamiento superviviente.
|
Si el almacenamiento para un nodo también pierde potencia al mismo tiempo, no será posible una toma de control estándar. |
-
No se reciben mensajes de latido del compañero del nodo. Esto podría suceder si el partner experimentó un error de hardware o software (por ejemplo, un fallo de interconexión) que no dio lugar a una situación de pánico, pero todavía impidió que funcionara correctamente.
-
Detenga uno de los nodos sin usar
-f
-inhibit-takeover true
el parámetro o.
|
En un clúster de dos nodos con la alta disponibilidad de clúster habilitada, la detención o el reinicio de un nodo mediante ‑inhibit‑takeover true el parámetro provoca que ambos nodos dejen de servir datos a menos que primero deshabilite la alta disponibilidad del clúster y, a continuación, asigne épsilon al nodo que desea permanecer online.
|
-
Se reinicia uno de los nodos sin utilizar
‑inhibit‑takeover true
el parámetro. (‑onboot`El parámetro del `storage failover
comando está habilitado de manera predeterminada). -
El dispositivo de gestión remota (Service Processor) detecta un fallo del nodo asociado. Esto no es aplicable si deshabilita la toma de control asistida por hardware.
También puede iniciar manualmente las tomas de control con storage failover takeover
el comando.
Mejoras en la resiliencia y el diagnóstico de clústeres
A partir de ONTAP 9,9.1, las siguientes adiciones de resiliencia y diagnóstico mejoran el funcionamiento del clúster:
-
Monitoreo y evitación de puertos: En configuraciones de clúster conmutado de dos nodos, el sistema evita los puertos que experimentan pérdida total de paquetes (pérdida de conectividad). En ONTAP 9.8.1 y versiones anteriores, esta funcionalidad solo estaba disponible en configuraciones conmutadas.
-
* Failover automático de nodos*: Si un nodo no puede servir datos a través de su red de clúster, ese nodo no debe poseer ningún disco. En lugar de eso, su partner de alta disponibilidad debería asumir el control si el partner está en buen estado.
-
Comandos para analizar problemas de conectividad: Utilice el siguiente comando para mostrar qué rutas de cluster están experimentando pérdida de paquetes:
network interface check cluster-connectivity show
Obtenga más información sobre
network interface check cluster-connectivity show
en el "Referencia de comandos del ONTAP".