Apague las controladoras: AFF A220 y FAS2700
Colaboradores
Apague o retome el controlador dañado siguiendo el procedimiento adecuado para su configuración.
Opción 1: Mayoría de las configuraciones
Este procedimiento es solamente para configuraciones de 2 nodos que no sean de MetroCluster. Si tiene un sistema con más de dos nodos, consulte "Cómo realizar un apagado y encendido con gracia de una pareja de alta disponibilidad en un clúster de 4 nodos".
Necesita:
-
Credenciales de administrador local para ONTAP.
-
Clave de acceso para todo el clúster de gestión de claves incorporada de NetApp (OKM) si se usa cifrado de almacenamiento.
-
Acceso a SP/BMC para cada controladora.
-
Detenga el acceso de todos los clientes/host a los datos del sistema de NetApp.
-
Suspender trabajos de backup externo.
-
Herramientas y equipos necesarios para la sustitución.
|
Si el sistema es un StorageGRID de NetApp o ONTAP S3 que se utiliza como nivel de cloud de FabricPool, consulte la "Apague y encienda sin problemas su Guía de resolución del sistema de almacenamiento" después de realizar este procedimiento. |
|
Si se utilizan LUN de cabina FlexArray, siga la documentación de cabina de almacenamiento específica del proveedor para el procedimiento de apagado que se debe ejecutar en esos sistemas después de realizar este procedimiento. |
|
Si utiliza SSD, consulte "SU490: (Impacto: Crítico) Mejores prácticas para las SSD: Evite el riesgo de un fallo de unidad y de pérdida de datos si se apaga durante más de dos meses" |
Como práctica recomendada antes del cierre, debe:
-
Realizar adicionales "comprobaciones de estado del sistema".
-
Actualice ONTAP a una versión recomendada para el sistema.
-
Resuelva cualquier "Alertas de estado y riesgos de Active IQ". Tome nota de cualquier fallo presente en el sistema, como los LED de los componentes del sistema.
-
Inicie sesión en el clúster a través de SSH o inicie sesión desde cualquier nodo del clúster mediante un cable de consola local y un equipo portátil/consola.
-
Desactive AutoSupport e indique cuánto tiempo espera que el sistema esté fuera de línea:
system node autosupport invoke -node * -type all -messages "MAINT=8h Power Maintenance"
-
Identifique la dirección del SP/BMC de todos los nodos:
system service-processor show -node * -fields address
-
Salga del shell de cluster:
exit
-
Inicie sesión en SP/BMC sobre SSH con la dirección IP de cualquiera de los nodos que aparecen en el resultado del paso anterior.
Si está usando una consola o portátil, inicie sesión en la controladora con las mismas credenciales de administrador de clúster.
Abra una sesión SSH en cada conexión SP/BMC de modo que pueda supervisar el progreso. -
Detenga todos los nodos del cluster:
system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true
.Para los clústeres que utilizan SnapMirror síncrono en modo StrictSync: system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
-
Introduzca y para cada controlador en el clúster cuando lo vea
Warning: Are you sure you want to halt node "cluster name-controller number"? {y|n}:
-
Espere a que cada controladora se detenga y muestre el aviso del CARGADOR.
-
Apague cada fuente de alimentación o desconéctela si no hay ningún interruptor de encendido/apagado de la fuente de alimentación.
-
Desconecte el cable de alimentación de cada fuente de alimentación.
-
Verifique que todas las controladoras del chasis dañado estén apagadas.
Opción 2: La controladora está en una configuración MetroCluster
|
No use este procedimiento si el sistema está en una configuración de MetroCluster de dos nodos. |
Para apagar el controlador dañado, debe determinar el estado del controlador y, si es necesario, tomar el control para que el controlador sano siga sirviendo datos del almacenamiento del controlador dañado.
-
Si tiene un clúster con más de dos nodos, debe estar en quórum. Si el clúster no tiene quórum o si una controladora en buen estado muestra falso según su condición, debe corregir el problema antes de apagar la controladora dañada; consulte "Sincronice un nodo con el clúster".
-
Si tiene una configuración MetroCluster, debe haber confirmado que el estado de configuración de MetroCluster está configurado y que los nodos están en estado normal y habilitado (
metrocluster node show
).
-
Si AutoSupport está habilitado, elimine la creación automática de casos invocando un mensaje de AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
El siguiente mensaje de AutoSupport suprime la creación automática de casos durante dos horas:
cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h
-
Deshabilite la devolución automática de la consola de la controladora en buen estado:
storage failover modify –node local -auto-giveback false
-
Lleve la controladora dañada al aviso DEL CARGADOR:
Si el controlador dañado está mostrando… Realice lo siguiente… El aviso del CARGADOR
Vaya a Quitar módulo de controlador.
Esperando devolución…
Pulse Ctrl-C y, a continuación, responda
y
cuando se le solicite.Solicitud del sistema o solicitud de contraseña (introduzca la contraseña del sistema)
Retome o detenga el controlador dañado del controlador en buen estado:
storage failover takeover -ofnode impaired_node_name
Cuando el controlador dañado muestre esperando devolución…, pulse Ctrl-C y, a continuación, responda
y
.