TR-4955: Recuperación ante desastres con Azure NetApp Files (ANF) y la solución VMware de Azure (AVS)
La recuperación ante desastres mediante replicación a nivel de bloques entre regiones del cloud es un método resiliente y rentable de proteger las cargas de trabajo frente a interrupciones del servicio del sitio y eventos de corrupción de datos (por ejemplo, ransomware).
Autor(es): Niyaz Mohamed, Ingeniería de Soluciones NetApp
Descripción general
Con la replicación de volúmenes entre regiones de Azure NetApp Files (ANF), las cargas de trabajo de VMware que se ejecutan en un sitio SDDC de Azure VMware Solution (AVS) usando Azure NetApp Files Volumes como almacén de datos NFS en el sitio de AVS principal se pueden replicar en un sitio de AVS secundario designado en la región de recuperación de destino.
El orquestador de recuperación ante desastres (DRO) (una solución basada en secuencia de comandos con una interfaz de usuario) puede utilizarse para recuperar sin problemas las cargas de trabajo replicadas desde un SDDC de AVS a otro. DRO automatiza la recuperación rompiendo la paridad de replicación y luego montando el volumen de destino como almacén de datos, a través del registro de VM en AVS, a las asignaciones de red directamente en NSX-T (incluido con todos los clouds privados de AVS).
Requisitos previos y recomendaciones generales
-
Compruebe que ha habilitado la replicación entre regiones mediante la creación de pares de replicación. Consulte "Crear replicación de volúmenes para Azure NetApp Files".
-
Debe configurar ExpressRoute Global Reach entre los clouds privados de Azure VMware Solution de origen y destino.
-
Debe tener un principal de servicio que pueda acceder a los recursos.
-
Se admite la siguiente topología: Sitio AVS primario al sitio AVS secundario.
-
Configure el "replicación" programe cada volumen de forma apropiada según las necesidades empresariales y la tasa de cambio de datos.
No se admiten las topologías en cascada y con ventilador de entrada y salida. |
Primeros pasos
Implementa la solución de VMware para Azure
La "Solución Azure VMware" (AVS) es un servicio de cloud híbrido que proporciona SDDC de VMware totalmente funcionales dentro de un cloud público de Microsoft Azure. AVS es una solución de primera parte totalmente gestionada y compatible con Microsoft y verificada por VMware que utiliza infraestructura de Azure. Por lo tanto, los clientes obtienen VMware ESXi para virtualización informática, vSAN para almacenamiento hiperconvergente y NSX para redes y seguridad, y todo ello al tiempo que aprovechan la presencia global de Microsoft Azure, instalaciones de centros de datos líderes de su clase y la proximidad al rico ecosistema de servicios y soluciones nativos de Azure. Una combinación de un SDDC de la solución para Azure VMware y Azure NetApp Files proporciona el mejor rendimiento con una latencia de red mínima.
Para configurar una nube privada AVS en Azure, siga los pasos que se indican en este "enlace" Para la documentación de NetApp y en este "enlace" Para obtener documentación de Microsoft. Se puede utilizar un entorno piloto configurado con una configuración mínima para recuperaciones ante desastres. Esta configuración solo contiene componentes principales para admitir aplicaciones esenciales y puede escalar horizontalmente y generar más hosts para asumir la mayor carga si se produce una recuperación tras fallos.
En la versión inicial, DRO admite un clúster SDDC AVS existente. La creación bajo demanda de SDDC estará disponible en una próxima versión. |
Aprovisione y configure Azure NetApp Files
"Azure NetApp Files" es un servicio de almacenamiento de archivos de uso medido, de nivel empresarial y de alto rendimiento. Siga los pasos que se indican a continuación "enlace" Para aprovisionar y configurar Azure NetApp Files como almacén de datos NFS para optimizar las puestas en marcha de cloud privado de AVS.
Crear una replicación de volumen para volúmenes de almacenes de datos que funcionan con Azure NetApp Files
El primer paso es configurar la replicación entre regiones para los volúmenes de almacén de datos deseados desde el sitio primario AVS al sitio secundario AVS con las frecuencias y retenciones apropiadas.
Siga los pasos que se indican a continuación "enlace" para configurar la replicación entre regiones mediante la creación de pares de replicación. El nivel de servicio del pool de capacidad de destino puede coincidir con el del pool de capacidad de origen. Sin embargo, para este caso de uso específico, puede seleccionar el nivel de servicio estándar y luego "modificar el nivel de servicio" En caso de desastre real o simulaciones de recuperación ante desastres.
Una relación de replicación entre regiones es un requisito previo y debe crearse de antemano. |
Instalación DE DRO
Para comenzar con DRO, use el sistema operativo Ubuntu en la máquina virtual de Azure designada y asegúrese de cumplir con los requisitos previos. A continuación, instale el paquete.
Requisitos previos:
-
Principal de servicio que puede acceder a los recursos.
-
Asegúrese de que existe conectividad adecuada con las instancias de SDDC y Azure NetApp Files de origen y destino.
-
La resolución DNS debe estar en su lugar si está utilizando nombres DNS. De lo contrario, use direcciones IP para vCenter.
Requisitos del sistema operativo:
-
Ubuntu Focal 20,04 (LTS)Los siguientes paquetes deben instalarse en la máquina virtual del agente designado:
-
Docker
-
Docker: Componer
-
JqChange
docker.sock
para este nuevo permiso:sudo chmod 666 /var/run/docker.sock
.
La deploy.sh el script ejecuta todos los requisitos necesarios.
|
Los pasos son los siguientes:
-
Descargue el paquete de instalación en la máquina virtual designada:
git clone https://github.com/NetApp/DRO-Azure.git
El agente debe instalarse en la región del sitio AVS secundario o en la región del sitio AVS principal en una zona de área de servicio independiente que el SDDC. -
Descomprima el paquete, ejecute el script de despliegue e introduzca la IP del host (por ejemplo,
10.10.10.10
).tar xvf draas_package.tar Navigate to the directory and run the deploy script as below: sudo sh deploy.sh
-
Acceda a la interfaz de usuario con las siguientes credenciales:
-
Nombre de usuario:
admin
-
Contraseña:
admin
-
Configuración DE DRO
Después de que Azure NetApp Files y AVS se hayan configurado correctamente, puede comenzar a configurar DRO para automatizar la recuperación de cargas de trabajo desde el sitio AVS principal al sitio AVS secundario. NetApp recomienda la puesta en marcha del agente DRO en el sitio AVS secundario y la configuración de la conexión de puerta de enlace ExpressRoute para que el agente DRO pueda comunicarse a través de la red con los componentes de AVS y Azure NetApp Files adecuados.
El primer paso es agregar credenciales. DRO requiere permiso para descubrir Azure NetApp Files y la solución Azure VMware. Puede otorgar los permisos necesarios a una cuenta de Azure creando y configurando una aplicación de Azure Active Directory (AD) y obteniendo las credenciales de Azure que DRO necesita. Debe enlazar el principal de servicio a su suscripción de Azure y asignarle un rol personalizado que tenga los permisos necesarios relevantes. Al agregar entornos de origen y destino, se le solicita que seleccione las credenciales asociadas al principal de servicio. Debe agregar estas credenciales a DRO antes de hacer clic en Agregar nuevo sitio.
Para realizar esta operación, complete los siguientes pasos:
-
Abra DRO en un navegador compatible y utilice el nombre de usuario y la contraseña predeterminados /
admin
/admin
). La contraseña se puede restablecer después del primer inicio de sesión mediante la opción Cambiar contraseña. -
En la parte superior derecha de la consola de DRO, haga clic en el icono Configuración y seleccione Credenciales.
-
Haga clic en Add New Credential y siga los pasos del asistente.
-
Para definir las credenciales, introduzca información sobre el principal de servicio de Azure Active Directory que otorga los permisos necesarios:
-
Nombre de credencial
-
ID de inquilino
-
ID del cliente
-
Secreto de cliente
-
ID de suscripción
Debe haber capturado esta información al crear la aplicación AD.
-
-
Confirme los detalles sobre las nuevas credenciales y haga clic en Add Credential.
Después de agregar las credenciales, es hora de detectar y agregar los sitios de AVS principales y secundarios (tanto vCenter como la cuenta de almacenamiento de Azure NetApp Files) a DRO. Para agregar el sitio de origen y destino, realice los siguientes pasos:
-
Vaya a la pestaña Discover.
-
Haga clic en Agregar nuevo sitio.
-
Agregue el siguiente sitio AVS principal (designado como Source en la consola).
-
SDDC vCenter
-
Cuenta de almacenamiento de Azure NetApp Files
-
-
Agregue el siguiente sitio AVS secundario (designado como Destino en la consola).
-
SDDC vCenter
-
Cuenta de almacenamiento de Azure NetApp Files
-
-
Agregue los detalles del sitio haciendo clic en Fuente, ingresando un nombre de sitio amigable, y seleccione el conector. A continuación, haga clic en continuar.
A modo de demostración, en este documento se trata la adición de un sitio de origen. -
Actualice los detalles de vCenter. Para ello, seleccione las credenciales, la región de Azure y el grupo de recursos del menú desplegable para el AVS SDDC principal.
-
DRO muestra todos los SDDC disponibles dentro de la región. Seleccione la URL de cloud privado designada del menú desplegable.
-
Introduzca el
cloudadmin@vsphere.local
credenciales de usuario. A esto se puede acceder desde Azure Portal. Siga los pasos mencionados en este "enlace". Una vez hecho esto, haga clic en Continuar. -
Seleccione los detalles de Source Storge (ANF) seleccionando el grupo de recursos de Azure y la cuenta de NetApp.
-
Haga clic en Crear sitio.
Una vez agregado, DRO realiza la detección automática y muestra las máquinas virtuales que tienen las réplicas entre regiones correspondientes desde el sitio de origen al sitio de destino. DRO detecta automáticamente las redes y los segmentos que utilizan las máquinas virtuales y los rellena.
El siguiente paso es agrupar los equipos virtuales necesarios en sus grupos funcionales como grupos de recursos.
Agrupaciones de recursos
Una vez agregadas las plataformas, agrupe las máquinas virtuales que desee recuperar en grupos de recursos. LOS grupos de recursos DE DRO permiten agrupar un conjunto de máquinas virtuales dependientes en grupos lógicos que contienen sus órdenes de arranque, retrasos de arranque y validaciones de aplicaciones opcionales que se pueden ejecutar tras la recuperación.
Para comenzar a crear grupos de recursos, haga clic en el elemento de menú Crear nuevo grupo de recursos.
-
Acceda a Resource Grou*ps y haga clic en *Crear nuevo grupo de recursos.
-
En Nuevo grupo de recursos, seleccione el sitio de origen en el menú desplegable y haga clic en Crear.
-
Proporcione los detalles del grupo de recursos y haga clic en Continuar.
-
Seleccione las máquinas virtuales apropiadas mediante la opción de búsqueda.
-
Seleccione el Boot Order y Boot Delay (segundos) para todas las VM seleccionadas. Establezca el orden de la secuencia de encendido seleccionando cada máquina virtual y configurando la prioridad para ella. El valor predeterminado para todas las máquinas virtuales es 3. Las opciones son las siguientes:
-
El primer equipo virtual que se enciende
-
Predeterminado
-
La última máquina virtual que se enciende
-
-
Haga clic en Crear grupo de recursos.
Planes de replicación
Es necesario tener un plan para la recuperación de aplicaciones en caso de desastre. Seleccione las plataformas vCenter de origen y destino en el menú desplegable, elija los grupos de recursos que se incluirán en este plan y también incluya la agrupación sobre cómo deben restaurarse y encenderse las aplicaciones (por ejemplo, controladores de dominio, nivel 1, nivel 2, etc.). A menudo, los planes también se denominan planos. Para definir el plan de recuperación, vaya a la pestaña Plan de replicación y haga clic en Nuevo plan de replicación.
Para comenzar a crear un plan de replicación, lleve a cabo los siguientes pasos:
-
Vaya a Planes de replicación y haga clic en Crear nuevo plan de replicación.
-
En New Replication Plan, proporcione un nombre para el plan y agregue asignaciones de recuperación seleccionando el sitio de origen, vCenter asociado, el sitio de destino y vCenter asociado.
-
Después de completar el mapeo de recuperación, seleccione el Cluster Mapping.
-
Seleccione Detalles del grupo de recursos y haga clic en continuar.
-
Establezca el orden de ejecución del grupo de recursos. Esta opción permite seleccionar la secuencia de operaciones cuando existen varios grupos de recursos.
-
Una vez hecho esto, defina la asignación de red en el segmento apropiado. Los segmentos ya se deben aprovisionar en el cluster AVS secundario y, para asignar las VM a ellas, seleccione el segmento apropiado.
-
Las asignaciones de almacenes de datos se seleccionan automáticamente según la selección de las máquinas virtuales.
La replicación entre regiones (CRR) se encuentra en el nivel del volumen. Por lo tanto, todas las máquinas virtuales que residen en el respectivo volumen se replican en el destino de CRR. Asegúrese de seleccionar todas las máquinas virtuales que forman parte del almacén de datos, ya que solo se procesan las máquinas virtuales que forman parte del plan de replicación. -
En Detalles de VM, opcionalmente puede cambiar el tamaño de los parámetros de CPU y RAM de VM. Esto puede ser muy útil cuando se recuperan entornos grandes en clústeres de destino de menor tamaño, o cuando se realizan pruebas de recuperación ante desastres sin tener que aprovisionar una infraestructura física de VMware uno a uno. Modifique además el orden de arranque y el retraso de inicio (segundos) para todas las máquinas virtuales seleccionadas en los grupos de recursos. Existe una opción adicional para modificar el orden de inicio si se requieren cambios en lo que seleccionó durante la selección de orden de inicio de grupo de recursos. De forma predeterminada, se utiliza el orden de inicio seleccionado durante la selección del grupo de recursos, sin embargo, se pueden realizar modificaciones en esta etapa.
-
Haga clic en Crear plan de replicación.Después de crear el plan de replicación, puede ejercer las opciones de failover, failover de prueba o migración dependiendo de sus requisitos.
Durante las opciones de conmutación por error y conmutación por error de prueba, se utiliza la instantánea más reciente o se puede seleccionar una instantánea específica a partir de una instantánea puntual. La opción point-in-time puede ser muy beneficiosa si te enfrentas a un evento de corrupción como ransomware, donde las réplicas más recientes ya están comprometidas o cifradas. DRO muestra todos los puntos de tiempo disponibles.
Para activar failover o failover de prueba con la configuración especificada en el plan de replicación, puede hacer clic en Failover o Test Failover. Puede supervisar el plan de replicación en el menú de tareas.
Una vez activada la conmutación al respaldo, los elementos recuperados pueden verse en el sitio secundario AVS SDDC vCenter (máquinas virtuales, redes y almacenes de datos). De forma predeterminada, las máquinas virtuales se recuperan en la carpeta Workload.
La conmutación tras recuperación se puede activar en el nivel del plan de replicación. En caso de conmutación por error de prueba, la opción de desmontaje puede utilizarse para revertir los cambios y eliminar el volumen recién creado. Los fallos relacionados con la conmutación al nodo de respaldo son un proceso de dos pasos. Seleccione el plan de replicación y seleccione Reverse Data Sync.
Una vez completado este paso, active la conmutación por recuperación para volver al sitio AVS principal.
Desde Azure Portal, podemos ver que el estado de la replicación se ha roto con los volúmenes apropiados que se asignaron al centro secundario AVS SDDC como volúmenes de lectura/escritura. Durante la conmutación al nodo de respaldo de prueba, DRO no asigna el volumen de destino o de réplica. En su lugar, crea un nuevo volumen de la instantánea de replicación entre regiones necesaria y expone el volumen como almacén de datos, que consume capacidad física adicional del pool de capacidad y garantiza que el volumen de origen no se modifique. En particular, las tareas de replicación pueden continuar durante las pruebas de recuperación ante desastres o clasificar los flujos de trabajo. Además, este proceso garantiza que la recuperación se puede limpiar sin el riesgo de que la réplica se destruya en caso de que se produzcan errores o se recuperen datos dañados.
Recuperación de ransomware
Recuperarse del ransomware puede ser una tarea abrumadora. Concretamente, puede ser difícil para las ORGANIZACIONES DE TECNOLOGÍA identificar cuál es el punto de retorno seguro y, una vez determinado esto, cómo garantizar que las cargas de trabajo recuperadas se protejan de los ataques que se producen (por ejemplo, al dañar al dormir o a través de aplicaciones vulnerables).
DRO hace frente a estas preocupaciones permitiendo a las organizaciones recuperarse de cualquier momento específico disponible. A continuación, las cargas de trabajo se recuperan en redes funcionales y aisladas, de modo que las aplicaciones pueden funcionar y comunicarse entre sí, pero no están expuestas a ningún tráfico norte-sur. Este proceso proporciona a los equipos de seguridad un lugar seguro para realizar análisis forenses e identificar cualquier malware oculto o dormido.
Conclusión
La solución de recuperación ante desastres de Azure NetApp Files y Azure VMware le ofrece los siguientes beneficios:
-
Aproveche la replicación entre regiones de Azure NetApp Files eficiente y resiliente.
-
Recupere en cualquier momento específico disponible con retención de SnapVault.
-
Automatizar por completo todos los pasos necesarios para recuperar cientos o miles de máquinas virtuales en los pasos de validación de almacenamiento, informática, red y aplicaciones.
-
La recuperación de cargas de trabajo aprovecha el proceso «Crear volúmenes nuevos a partir de las instantáneas más recientes», que no manipula el volumen replicado.
-
Evite el riesgo de que se dañen los datos en los volúmenes o las copias Snapshot.
-
Evite las interrupciones de replicación durante los flujos de trabajo de pruebas de recuperación ante desastres.
-
Aproveche los datos de recuperación ante desastres y los recursos tecnológicos en el cloud para flujos de trabajo más allá de la recuperación ante desastres, como desarrollo y pruebas, pruebas de seguridad, pruebas de revisiones y actualizaciones, y pruebas de correcciones.
-
La optimización de CPU y RAM puede ayudar a reducir los costes de la nube al permitir la recuperación en clústeres de computación más pequeños.
Dónde encontrar información adicional
Si quiere más información sobre el contenido de este documento, consulte los siguientes documentos o sitios web:
-
Crear replicación de volúmenes para Azure NetApp Files
-
Replicación entre regiones de los volúmenes de Azure NetApp Files
-
Ponga en marcha y configure el entorno de virtualización en Azure
-
Pon en marcha y configura la solución Azure VMware