Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Obtenga más información sobre la gestión de pares de alta disponibilidad en clústeres de ONTAP

Colaboradores netapp-jsnyder netapp-aherbin netapp-bhouser netapp-aaron-holt netapp-dbagwell netapp-lisa netapp-barbe

Los nodos del clúster están configurados en pares de alta disponibilidad (HA) para tolerancia a fallos y operaciones sin interrupciones. Si un nodo falla o si necesita desconectar un nodo para realizar un mantenimiento rutinario, su socio puede hacerse cargo de su almacenamiento y continuar sirviendo datos desde él. El socio devuelve el almacenamiento cuando el nodo vuelve a estar en línea.

La configuración del controlador de par HA consiste en un par de controladores de almacenamiento coincidentes (nodo local y nodo asociado). Cada uno de estos nodos está conectado a las bandejas de discos de los demás. Cuando un nodo de un par HA encuentra un error y deja de procesar datos, su compañero detecta el estado de fallo del compañero y asume todo el procesamiento de datos de ese controlador.

Takeover es el proceso en el que un nodo asume el control sobre el almacenamiento de su partner.

Giveback es el proceso en el que el almacenamiento se devuelve al partner.

De forma predeterminada, las adquisiciones se realizan automáticamente en cualquiera de las siguientes situaciones:

  • Se produce un fallo del sistema o software en un nodo que provoca una caída en alarma. Las controladoras de parejas de alta disponibilidad conmutan automáticamente al nodo de su partner. Una vez que el partner se ha recuperado de la alarma y se ha iniciado, el nodo realiza automáticamente una devolución, devolviendo al partner al funcionamiento normal.

  • Se produce un fallo del sistema en un nodo y el nodo no se puede reiniciar. Por ejemplo, cuando un nodo falla debido a una pérdida de alimentación, las controladoras de parejas de alta disponibilidad conmuta automáticamente a su nodo de partner y sirven los datos de la controladora de almacenamiento superviviente.

Nota Si el almacenamiento para un nodo también pierde potencia al mismo tiempo, no será posible una toma de control estándar.
  • No se reciben mensajes de latido del compañero del nodo. Esto podría suceder si el partner experimentó un error de hardware o software (por ejemplo, un fallo de interconexión) que no dio lugar a una situación de pánico, pero todavía impidió que funcionara correctamente.

  • Detenga uno de los nodos sin usar -f -inhibit-takeover true el parámetro o.

Nota En un clúster de dos nodos con la alta disponibilidad de clúster habilitada, la detención o el reinicio de un nodo mediante ‑inhibit‑takeover true el parámetro provoca que ambos nodos dejen de servir datos a menos que primero deshabilite la alta disponibilidad del clúster y, a continuación, asigne épsilon al nodo que desea permanecer online.
  • Se reinicia uno de los nodos sin utilizar ‑inhibit‑takeover true el parámetro. ( ‑onboot`El parámetro del `storage failover comando está habilitado de manera predeterminada).

  • El dispositivo de gestión remota (Service Processor) detecta un fallo del nodo asociado. Esto no es aplicable si deshabilita la toma de control asistida por hardware.

También puede iniciar manualmente las tomas de control con storage failover takeover el comando.

A partir de ONTAP 9.18.1, puede configurar la comunicación cifrada entre nodos de pares HA. Para obtener más información, consulte"Configure el cifrado para el tráfico de alta disponibilidad de ONTAP." .

Mejoras en la resiliencia y el diagnóstico de clústeres

A partir de ONTAP 9,9.1, las siguientes adiciones de resiliencia y diagnóstico mejoran el funcionamiento del clúster:

  • Monitoreo y evitación de puertos: En configuraciones de clúster conmutado de dos nodos, el sistema evita los puertos que experimentan pérdida total de paquetes (pérdida de conectividad). En ONTAP 9.8.1 y versiones anteriores, esta funcionalidad solo estaba disponible en configuraciones conmutadas.

  • * Failover automático de nodos*: Si un nodo no puede servir datos a través de su red de clúster, ese nodo no debe poseer ningún disco. En lugar de eso, su partner de alta disponibilidad debería asumir el control si el partner está en buen estado.

  • Comandos para analizar problemas de conectividad: Utilice el siguiente comando para mostrar qué rutas de cluster están experimentando pérdida de paquetes: network interface check cluster-connectivity show

    Obtenga más información sobre network interface check cluster-connectivity show en el "Referencia de comandos del ONTAP".