Recuperación ante desastres con CVO y AVS (almacenamiento conectado a invitado)
La recuperación ante desastres en el cloud es un método resiliente y rentable de proteger las cargas de trabajo contra interrupciones del sitio y eventos dañados por datos como ransomware. Con SnapMirror de NetApp, las cargas de trabajo de VMware en las instalaciones que utilizan el almacenamiento conectado a invitado se pueden replicar a Cloud Volumes ONTAP de NetApp que se ejecuta en Azure.
Descripción general
Autores: Ravi BCB y Niyaz Mohamed, NetApp
This covers application data; however, what about the actual VMs themselves. Disaster recovery should cover all dependent components, including virtual machines, VMDKs, application data, and more. To accomplish this, SnapMirror along with Jetstream can be used to seamlessly recover workloads replicated from on-premises to Cloud Volumes ONTAP while using vSAN storage for VM VMDKs. Este documento proporciona un enfoque paso a paso para configurar y realizar la recuperación ante desastres que utiliza SnapMirror, JetStream y la solución Azure VMware (AVS) de NetApp.
Supuestos
Este documento se centra en el almacenamiento invitado para datos de aplicaciones (también conocido como «guest» conectado) y asumimos que el entorno local utiliza SnapCenter para realizar backups coherentes con las aplicaciones.
Este documento es aplicable a cualquier solución de backup o recuperación de terceros. Dependiendo de la solución utilizada en el entorno, siga las prácticas recomendadas para crear normativas de backup que cumplan los acuerdos de nivel de servicio de la organización. |
Para obtener conectividad entre el entorno local y la red virtual de Azure, utilice el alcance global de la ruta Express o una WAN virtual con una puerta de enlace VPN. Los segmentos se deben crear en función del diseño VLAN en las instalaciones.
Existen múltiples opciones para conectar los centros de datos en las instalaciones a Azure, lo que nos impide esbozar un flujo de trabajo específico en este documento. Consulte la documentación de Azure para conocer el método de conectividad apropiado entre las instalaciones y Azure. |
Implementar la solución DR
Descripción general de la puesta en marcha de soluciones
-
Asegúrese de que se realiza el backup de los datos de la aplicación mediante SnapCenter con los requisitos de punto de recuperación necesarios.
-
Aprovisione Cloud Volumes ONTAP con el tamaño de instancia correcto usando Cloud Manager dentro de la suscripción y la red virtual adecuadas.
-
Configurar SnapMirror para los volúmenes correspondientes de las aplicaciones.
-
Actualice las políticas de backup en SnapCenter para activar actualizaciones de SnapMirror después de los trabajos programados.
-
-
Instale el software de recuperación ante desastres JetStream en el centro de datos local y comience la protección de las máquinas virtuales.
-
Instalar el software de recuperación ante desastres JetStream en el cloud privado de Azure VMware Solution.
-
Durante un evento de desastre, rompa la relación de SnapMirror con Cloud Manager y active la conmutación por error de máquinas virtuales a Azure NetApp Files o a almacenes de datos VSAN en el sitio de recuperación ante desastres AVS designado.
-
Vuelva a conectar las LUN ISCSI y los montajes NFS para los equipos virtuales de la aplicación.
-
-
Invoque la conmutación tras recuperación al sitio protegido mediante la resincronización inversa de SnapMirror una vez que se haya recuperado el sitio principal.
Detalles de la implementación
Configurar CVO en Azure y replicar volúmenes a CVO
El primer paso es configurar Cloud Volumes ONTAP en Azure ("Enlace") Y replicar los volúmenes deseados en Cloud Volumes ONTAP con las frecuencias y retentions de instantánea deseadas.
Configurar los hosts AVS y el acceso a datos CVO
Dos factores importantes que se deben tener en cuenta al implementar el SDDC son el tamaño del clúster en la solución Azure VMware y el tiempo que se debe mantener el SDDC en servicio. Estas dos consideraciones clave para una solución de recuperación ante desastres ayudan a reducir los costes operativos generales. SDDC puede ser de tan solo tres hosts, hasta un clúster de varios hosts en una puesta en marcha a escala completa.
La decisión de poner en marcha un clúster AVS se basa principalmente en los requisitos de RPO/RTO. Con la solución para Azure VMware, el SDDC se puede aprovisionar justo a tiempo como preparación para pruebas o ante un desastre real. Un SDDC implementado en el tiempo ahorra en costes de host ESXi cuando no se enfrenta a un desastre. Sin embargo, esta forma de puesta en marcha afecta al objetivo de tiempo de recuperación en unas pocas horas, mientras que se aprovisiona SDDC.
La opción más común implementada es tener SDDC en funcionamiento en un modo de funcionamiento siempre activo y con luz piloto. Esta opción proporciona una huella pequeña de tres hosts siempre disponibles y también acelera las operaciones de recuperación, ya que proporciona una línea de base en ejecución para las actividades de simulación y comprobaciones de cumplimiento de normativas, lo que evita el riesgo de que se produzca una desviación operativa entre los sitios de producción y de recuperación ante desastres. El grupo piloto se puede escalar verticalmente rápidamente hasta el nivel deseado cuando es necesario para gestionar un evento de recuperación ante desastres real.
Para configurar AVS SDDC (ya sea a petición o en modo piloto), consulte "Ponga en marcha y configure el entorno de virtualización en Azure". Como requisito previo, verifique que los equipos virtuales invitados que residen en los hosts AVS pueden consumir datos de Cloud Volumes ONTAP una vez establecida la conectividad.
Una vez que Cloud Volumes ONTAP y AVS se hayan configurado correctamente, comience a configurar JetStream para automatizar la recuperación de las cargas de trabajo en las instalaciones en AVS (VM con VMDK de aplicación y equipos virtuales con almacenamiento en invitado) mediante el mecanismo VAIO y aprovechando SnapMirror para copias de volúmenes de aplicación en Cloud Volumes ONTAP.
Instalar JetStream DR en el centro de datos local
El software JetStream DR consta de tres componentes principales: JetStream DR Management Server Virtual Appliance (MSA), DR Virtual Appliance (DRVA) y componentes host (paquetes de filtros de I/o). MSA se utiliza para instalar y configurar componentes host en el cluster informático y, a continuación, administrar el software JetStream DR. El proceso de instalación es el siguiente:
-
Compruebe los requisitos previos.
-
Ejecute la herramienta de planificación de la capacidad para realizar recomendaciones de recursos y configuración.
-
Implemente JetStream DR MSA en cada host de vSphere en el clúster designado.
-
Inicie MSA usando su nombre DNS en un explorador.
-
Registre el servidor vCenter con el MSA.
-
Una vez que se haya puesto en marcha JetStream DR MSA y se haya registrado vCenter Server, desplácese hasta el complemento de recuperación ante desastres JetStream con vSphere Web Client. Para ello, vaya a Datacenter > Configure > JetStream DR.
-
Desde la interfaz DR de JetStream, realice las siguientes tareas:
-
Configure el clúster con el paquete de filtro de I/O.
-
Añada el almacenamiento de Azure Blob que está situado en el sitio de recuperación.
-
-
Implemente el número necesario de dispositivos virtuales de recuperación ante desastres (DRVAs) desde la ficha Appliances (dispositivos virtuales).
Utilice la herramienta de planificación de la capacidad para calcular el número de DRVAs necesarios. -
Cree volúmenes de registro de replicación para cada DRVA utilizando el VMDK desde los almacenes de datos disponibles o el pool de almacenamiento iSCSI compartido independiente.
-
En la pestaña Protected Domains, cree la cantidad necesaria de dominios protegidos utilizando información acerca del sitio de Azure Blob Storage, la instancia de DRVA y el registro de replicación. Un dominio protegido define una máquina virtual o un conjunto específico de máquinas virtuales de aplicación dentro del clúster que se protegen en conjunto y asignó un orden de prioridad para las operaciones de conmutación por error y conmutación tras recuperación.
-
Seleccione las máquinas virtuales que se van a proteger y agrupe las máquinas virtuales en grupos de aplicaciones en función de la dependencia. Las definiciones de aplicaciones le permiten agrupar conjuntos de máquinas virtuales en grupos lógicos que contengan sus órdenes de arranque, retrasos de arranque y validaciones de aplicaciones opcionales que se pueden ejecutar tras la recuperación.
Asegúrese de que se utilice el mismo modo de protección para todas las máquinas virtuales de un dominio protegido. El modo Write-Back (VMDK) ofrece un mayor rendimiento. -
Asegúrese de que los volúmenes de registros de replicación se colocan en un almacenamiento de alto rendimiento.
-
Una vez que haya terminado, haga clic en Iniciar protección para el dominio protegido. Esto inicia la replicación de datos de las máquinas virtuales seleccionadas en el almacén BLOB designado.
-
Una vez finalizada la replicación, el estado de protección del equipo virtual se Marca como recuperable.
Los runbooks pueden configurarse para agrupar los equipos virtuales (denominados «grupo de recuperación»), establecer la secuencia de órdenes de arranque y modificar la configuración de CPU/memoria junto con las configuraciones de IP. -
Haga clic en Configuración y, a continuación, en el enlace Configurar libro de ejecución para configurar el grupo de libro de ejecución.
-
Haga clic en el botón Crear grupo para comenzar a crear un nuevo grupo runbook.
Si es necesario, en la parte inferior de la pantalla, aplique scripts previos y posteriores personalizados para que se ejecuten automáticamente antes y después del funcionamiento del grupo runbook. Asegúrese de que los scripts de Runbook residen en el servidor de administración. -
Edite la configuración de la máquina virtual según sea necesario. Especifique los parámetros para recuperar las VM, incluida la secuencia de arranque, el retraso de arranque (especificado en segundos), el número de CPU y la cantidad de memoria que se debe asignar. Cambie la secuencia de arranque de las VM haciendo clic en las flechas arriba o abajo. También se proporcionan opciones para conservar MAC.
-
Las direcciones IP estáticas pueden configurarse manualmente para las máquinas virtuales individuales del grupo. Haga clic en el enlace NIC View de una máquina virtual para configurar manualmente las opciones de su dirección IP.
-
Haga clic en el botón Configure para guardar los ajustes de NIC de los equipos virtuales correspondientes.
El estado de los runbooks de conmutación por error y conmutación por recuperación se muestra ahora como configurado. Los grupos de runbooks de conmutación por error y conmutación tras recuperación se crean en parejas utilizando el mismo grupo inicial de máquinas virtuales y configuraciones. Si es necesario, la configuración de cualquier grupo runbook se puede personalizar individualmente haciendo clic en el vínculo Detalles correspondiente y realizando cambios.
Instale JetStream DR para AVS en la nube privada
Una práctica recomendada para un sitio de recuperación (AVS) es crear un clúster de tres nodos de luz piloto con antelación. Esto permite configurar la infraestructura del centro de recuperación, lo que incluye lo siguiente:
-
Segmentos de red de destino, firewalls, servicios como DHCP y DNS, etc.
-
Instalación de JetStream DR para AVS
-
La configuración de volúmenes ANF como almacenes de datos y mucho más
Jetstream DR admite un modo RTO casi cero para los dominios de misión crítica. Para estos dominios, el almacenamiento de destino debe estar preinstalado. ANF es un tipo de almacenamiento recomendado en este caso.
La configuración de la red, incluida la creación de segmentos, se debe configurar en el clúster AVS para que coincida con los requisitos en las instalaciones. |
Según los requisitos del acuerdo de nivel de servicio y el objetivo de tiempo de recuperación, puede utilizar la conmutación por error continua o el modo de conmutación por error normal (estándar). Para lograr un objetivo de tiempo de recuperación cercano a cero, debe comenzar una rehidratación continua en el sitio de recuperación. |
-
Para instalar JetStream DR para AVS en un cloud privado de Azure VMware Solution, utilice el comando Run. En el portal de Azure, vaya a la solución VMware de Azure, seleccione la nube privada y seleccione Ejecutar comando > Paquetes > JSDR.Configuration.
El usuario CloudAdmin predeterminado de la solución VMware de Azure no tiene suficientes privilegios para instalar JetStream DR para AVS. La solución Azure VMware permite una instalación simplificada y automatizada de la recuperación ante desastres de JetStream mediante la llamada al comando Azure VMware Solution Run para la recuperación ante desastres de JetStream. La siguiente captura de pantalla muestra la instalación mediante una dirección IP basada en DHCP.
-
Una vez finalizada la instalación de JetStream DR para AVS, actualice el explorador. Para acceder a la interfaz de usuario de recuperación ante desastres de JetStream, vaya a SDDC Datacenter > Configure > JetStream DR.
-
Desde la interfaz DR de JetStream, realice las siguientes tareas:
-
Añada la cuenta de Azure Blob Storage que se utilizó para proteger el clúster local como sitio de almacenamiento y, a continuación, ejecute la opción Scan Domains.
-
En la ventana emergente de diálogo que aparece, seleccione el dominio protegido que desea importar y, a continuación, haga clic en el vínculo Importar.
-
-
El dominio se importa para la recuperación. Vaya a la ficha Dominios protegidos y compruebe que el dominio deseado se ha seleccionado o elija el que desee en el menú Seleccionar dominio protegido. Se muestra una lista de las máquinas virtuales recuperables del dominio protegido.
-
Después de importar los dominios protegidos, implemente dispositivos DRVA.
Estos pasos también se pueden automatizar mediante planes creados por CPT. -
Cree volúmenes de registros de replicación con almacenes de datos VSAN o ANF disponibles.
-
Importe los dominios protegidos y configure el va de recuperación para utilizar un almacén de datos ANF para las ubicaciones de las máquinas virtuales.
Asegúrese de que DHCP está habilitado en el segmento seleccionado y de que hay suficientes IP disponibles. Las IP dinámicas se utilizan temporalmente mientras se recuperan los dominios. Cada VM que se recupera (incluida la rehidratación continua) requiere una IP dinámica individual. Una vez finalizada la recuperación, se libera la IP y se puede volver a utilizar. -
Seleccione la opción de conmutación por error adecuada (conmutación por error continua o conmutación por error). En este ejemplo, se selecciona la rehidratación continua (conmutación por error continua).
Aunque los modos de conmutación por error continua y conmutación por error varían cuando se realiza la configuración, ambos modos de conmutación por error se configuran siguiendo los mismos pasos. Los pasos de conmutación por error se configuran y se realizan de forma conjunta en respuesta a un evento de desastre. La conmutación por error continua se puede configurar en cualquier momento y luego se puede ejecutar en segundo plano durante el funcionamiento normal del sistema. Una vez ocurrido un evento de desastre, la conmutación al respaldo continua se completa para transferir inmediatamente la propiedad de las máquinas virtuales protegidas al sitio de recuperación (objetivo de tiempo de recuperación cercano a cero).
El proceso de conmutación al respaldo continua comienza y su progreso se puede supervisar desde la interfaz de usuario. Al hacer clic en el icono azul de la sección Paso actual se muestra una ventana emergente que muestra los detalles del paso actual del proceso de conmutación por error.
Conmutación por error y conmutación por recuperación
-
Cuando se produce un desastre en el clúster protegido del entorno local (fallo parcial o completo), puede activarse la conmutación por error para máquinas virtuales mediante Jetstream tras romper la relación de SnapMirror con los volúmenes de aplicaciones correspondientes.
Este paso puede automatizarse fácilmente para facilitar el proceso de recuperación. -
Acceda a Jetstream UI en AVS SDDC (destino) y active la opción de recuperación tras fallos para completar la recuperación tras fallos. La barra de tareas muestra el progreso de las actividades de failover.
En la ventana de diálogo que aparece al finalizar la conmutación por error, la tarea de conmutación por error se puede especificar como planificada o se supone que se fuerza.
La conmutación por error forzada asume que el sitio principal ya no está accesible y que el sitio de recuperación debería asumir directamente la propiedad del dominio protegido.
-
Una vez finalizada la conmutación por error continua, aparece un mensaje que confirma la finalización de la tarea. Una vez finalizada la tarea, acceda a los equipos virtuales recuperados para configurar sesiones ISCSI o NFS.
El modo de recuperación tras fallos cambia a ejecutarse en Failover y el estado del equipo virtual es recuperable. Todas las máquinas virtuales del dominio protegido ahora se ejecutan en el sitio de recuperación con el estado especificado por la configuración de runbook para conmutación por error. Para verificar la configuración de recuperación tras fallos y la infraestructura, JetStream puede utilizarse en modo de prueba (opción de conmutación por error de prueba) para observar la recuperación de máquinas virtuales y sus datos desde el almacén de objetos en un entorno de recuperación de pruebas. Cuando se ejecuta un procedimiento de conmutación por error en el modo de prueba, su operación se asemeja a un proceso de conmutación por error real. -
Después de recuperar las máquinas virtuales, utilice la recuperación ante desastres de almacenamiento para el almacenamiento invitado. Para demostrar este proceso, se utiliza SQL Server en este ejemplo.
-
Inicie sesión en el SnapCenter VM recuperado en AVS SDDC y habilite el modo de recuperación ante desastres.
-
Acceda a la interfaz de usuario de SnapCenter mediante el comando browserN.
-
En la página Settings, vaya a Settings > Global Settings > Disaster Recovery.
-
Seleccione Enable Disaster Recovery.
-
Haga clic en Apply.
-
Compruebe si el trabajo de recuperación ante desastres está habilitado. Para ello, haga clic en Monitor > Jobs.
NetApp SnapCenter 4.6 o posterior deben utilizarse para la recuperación ante desastres de almacenamiento. En las versiones anteriores, se deben utilizar snapshots coherentes con la aplicación (replicados mediante SnapMirror) y se debe ejecutar la recuperación manual en caso de que los backups anteriores se recuperen en el centro de recuperación ante desastres.
-
-
Asegúrese de que la relación de SnapMirror esté rota.
-
Asociar la LUN de Cloud Volumes ONTAP a la máquina virtual invitada de SQL recuperada con las mismas letras de unidad.
-
Abra el iniciador iSCSI, borre la sesión desconectada anterior y añada el nuevo destino junto con la multivía para los volúmenes Cloud Volumes ONTAP replicados.
-
Asegúrese de que todos los discos están conectados utilizando las mismas letras de unidad que se usaron antes de la recuperación ante desastres.
-
Reinicie el servicio del servidor MSSQL.
-
Asegúrese de que los recursos SQL vuelven a estar en línea.
En el caso de NFS, asocie los volúmenes con el comando Mount y actualice el /etc/fstab
entradas.En este momento, pueden ejecutarse las operaciones y el negocio continúa de forma normal.
En el extremo de NSX-T, es posible crear una pasarela de nivel 1 dedicada separada para simular escenarios de conmutación por error. De este modo, se garantiza que todas las cargas de trabajo se puedan comunicar entre sí, pero que ningún tráfico pueda enrutarse tanto dentro como fuera del entorno, de modo que las tareas de clasificación, contención o endurecimiento se puedan realizar sin riesgo de contaminación cruzada. Esta operación se encuentra fuera del alcance de este documento, pero se puede realizar fácilmente para simular el aislamiento.
Una vez que la instalación principal esté activa y en funcionamiento de nuevo, puede realizar la conmutación tras recuperación. JetStream reanuda la protección de máquinas virtuales y debe revertirse la relación de SnapMirror.
-
Restaure el entorno de sus instalaciones. En función del tipo de incidente de desastre, podría ser necesario restaurar o verificar la configuración del clúster protegido. Si es necesario, puede que sea necesario volver a instalar el software JetStream DR.
-
Acceda al entorno local restaurado, vaya a la interfaz de usuario de recuperación ante desastres de Jetstream y seleccione el dominio protegido adecuado. Una vez que el sitio protegido esté listo para la conmutación tras recuperación, seleccione la opción de conmutación por recuperación en la interfaz de usuario.
El plan de conmutación por recuperación generado por CPT también se puede usar para iniciar la devolución de los equipos virtuales y sus datos del almacén de objetos al entorno VMware original. Especifique la demora máxima después de pausar las máquinas virtuales en el sitio de recuperación y reiniciarlas en el sitio protegido. El tiempo necesario para completar este proceso incluye la finalización de la replicación tras detener la conmutación por error de las máquinas virtuales, el tiempo necesario para limpiar el sitio de recuperación y el tiempo necesario para recrear las máquinas virtuales en el sitio protegido. NetApp recomienda 10 minutos. -
Completar el proceso de conmutación tras recuperación y, a continuación, confirmar la reanudación de la protección de los equipos virtuales y la consistencia de datos.
-
Una vez recuperados los equipos virtuales, desconecte el almacenamiento secundario del host y conéctelo al almacenamiento principal.
-
Reinicie el servicio del servidor MSSQL.
-
Compruebe que los recursos de SQL vuelven a estar en línea.
Para volver a realizar la conmutación tras recuperación al almacenamiento principal, asegúrese de que la dirección de la relación sigue siendo la misma que antes de la conmutación por error realizando una operación de resincronización inversa. Para conservar las funciones de almacenamiento primario y secundario después de la operación de resincronización inversa, vuelva a realizar la operación de resincronización inversa.
Este proceso es aplicable a otras aplicaciones como Oracle, tipos de base de datos similares y cualquier otra aplicación que utilice almacenamiento conectado a «guest».
Como siempre, probar los pasos necesarios para recuperar las cargas de trabajo críticas antes de ponerlas en producción.
Ventajas de esta solución
-
Usa la replicación eficiente y resiliente de SnapMirror.
-
Recupera a cualquier punto disponible en el tiempo con la retención de copias Snapshot de ONTAP.
-
Existe una automatización completa a disposición de todos los pasos necesarios para recuperar de cientos a miles de VM, desde los pasos de almacenamiento, computación, red y validación de aplicaciones.
-
SnapCenter utiliza mecanismos de clonado que no cambian el volumen replicado.
-
Esto evita el riesgo de daños en los datos de los volúmenes y las Snapshot.
-
Evita interrupciones de replicación durante los flujos de trabajo de pruebas de recuperación ante desastres.
-
Aprovecha los datos de recuperación ante desastres para flujos de trabajo que van más allá de la recuperación ante desastres, como las fases de desarrollo y pruebas, pruebas de seguridad, pruebas de parches y actualizaciones, y pruebas para solucionar problemas.
-
-
La optimización de la CPU y la RAM puede ayudar a reducir los costes del cloud al permitir la recuperación en clústeres informáticos más pequeños.