Conmutación por error de ONTAP
Es necesario comprender las funciones de adquisición de almacenamiento para garantizar que las operaciones de la base de datos Oracle no se interrumpan durante estas operaciones. Además, los argumentos utilizados en las operaciones de adquisición pueden afectar la integridad de los datos si se utilizan incorrectamente.
En condiciones normales, las escrituras entrantes a un controlador determinado se reflejan de manera sincrónica en su socio de alta disponibilidad. En un entorno ASA r2 con SnapMirror Active Sync (SM-as), las escrituras también se reflejan en un controlador remoto en el sitio secundario. Hasta que una escritura no se almacena en un medio no volátil en todas las ubicaciones, no se reconoce en la aplicación host.
El medio que almacena los datos escritos se llama memoria no volátil (NVMEM). A veces se la denomina memoria de acceso aleatorio no volátil (NVRAM) y puede considerarse como un diario de escritura en lugar de un caché. Durante el funcionamiento normal, los datos de NVMEM no se leen; solo se utilizan para proteger los datos en caso de una falla de software o hardware. Cuando se escriben datos en las unidades, los datos se transfieren desde la RAM del sistema, no desde NVMEM.
Durante una operación de adquisición, un nodo de un par de HA se hace cargo de las operaciones de su socio. En ASA r2, el cambio no es aplicable porque no se admite MetroCluster ; en su lugar, SnapMirror Active Sync proporciona redundancia a nivel de sitio. Las operaciones de toma de control de almacenamiento durante el mantenimiento de rutina deben ser transparentes, salvo una breve pausa en las operaciones a medida que cambian las rutas de la red. Las redes pueden ser complejas y es fácil cometer errores, por lo que NetApp recomienda encarecidamente probar exhaustivamente las operaciones de adquisición antes de poner un sistema de almacenamiento en producción. Hacerlo es la única forma de garantizar que todas las rutas de red estén configuradas correctamente. En un entorno SAN, verifique el estado de la ruta mediante el comando sanlun lun show -p o las herramientas de múltiples rutas nativas del sistema operativo para garantizar que todas las rutas esperadas estén disponibles. Los sistemas ASA r2 proporcionan todas las rutas optimizadas activas para LUN, y los clientes que usan espacios de nombres NVMe deben confiar en herramientas nativas del sistema operativo, ya que sanlun no cubre las rutas NVMe.
Se debe tener cuidado al emitir una adquisición forzosa. Forzar un cambio en la configuración de almacenamiento significa que se ignora el estado del controlador que posee las unidades y el nodo alternativo toma el control de las unidades de manera forzosa. La forzamiento incorrecto de una toma de control puede provocar pérdida o corrupción de datos porque una toma de control forzada puede descartar el contenido de NVMEM. Una vez completada la adquisición, la pérdida de esos datos significa que los datos almacenados en las unidades podrían volver a un estado ligeramente más antiguo desde el punto de vista de la base de datos.
En raras ocasiones debería ser necesaria una adquisición forzada con un par HA normal. En casi todos los escenarios de falla, un nodo se apaga e informa al socio para que se realice una conmutación por error automática. Hay algunos casos extremos, como una falla continua en la que se pierde la interconexión entre los nodos y luego falla un controlador, en los que se requiere una toma de control forzada. En tal situación, la duplicación entre nodos se pierde antes de la falla del controlador, lo que significa que el controlador sobreviviente ya no tiene una copia de las escrituras en progreso. Luego es necesario forzar la toma de control, lo que potencialmente implica una pérdida de datos.
|
|
NetApp recomienda tomar las siguientes precauciones:
|