Sustituya el módulo de almacenamiento en caché - FAS8200
Colaboradores
Debe sustituir el módulo de almacenamiento en caché en el módulo de la controladora cuando el sistema registre un único mensaje de AutoSupport (ASUP) que el módulo se haya desconectado; de lo contrario, el rendimiento se degradará.
Tal vez desee borrar el contenido del módulo de almacenamiento en caché antes de reemplazarlo.
-
Aunque los datos del módulo de almacenamiento en caché están cifrados, es posible que desee borrar los datos del módulo de almacenamiento en caché dañado y verificar que el módulo de almacenamiento en caché no tiene datos:
-
Borre los datos del módulo de almacenamiento en caché:
system controller flash-cache secure-erase run -node node name localhost -device-id device_number
Ejecute el system controller flash-cache show
Comando si no conoce el identificador de dispositivo de flashcache. -
Compruebe que los datos se han borrado del módulo de almacenamiento en caché:
system controller flash-cache secure-erase show
-
-
Debe sustituir el componente con errores por un componente FRU de repuesto que haya recibido de su proveedor.
Paso 1: Apague el controlador dañado
Puede apagar o hacerse cargo de la controladora dañada siguiendo diferentes procedimientos, en función de la configuración del hardware del sistema de almacenamiento.
Para apagar el controlador dañado, debe determinar el estado del controlador y, si es necesario, tomar el control para que el controlador sano siga sirviendo datos del almacenamiento del controlador dañado.
-
Si utiliza el cifrado de almacenamiento de NetApp, debe haber restablecido el MSID mediante las instrucciones de "Volviendo al modo SED a no protegido".
-
Si dispone de un sistema SAN, debe haber comprobado los mensajes de eventos
cluster kernel-service show
) Para el blade SCSI del controlador dañado. Lacluster kernel-service show
comando muestra el nombre del nodo, el estado de quórum de ese nodo, el estado de disponibilidad de ese nodo y el estado operativo de ese nodo.Cada proceso SCSI-blade debe quórum con los otros nodos del clúster. Todos los problemas deben resolverse antes de continuar con el reemplazo.
-
Si tiene un clúster con más de dos nodos, debe estar en quórum. Si el clúster no tiene quórum o si una controladora en buen estado muestra falso según su condición, debe corregir el problema antes de apagar la controladora dañada; consulte "Sincronice un nodo con el clúster".
-
Si AutoSupport está habilitado, elimine la creación automática de casos invocando un mensaje de AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
El siguiente mensaje de AutoSupport suprime la creación automática de casos durante dos horas:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
Deshabilite la devolución automática de la consola de la controladora en buen estado:
storage failover modify –node local -auto-giveback false
Cuando vea do desea desactivar la devolución automática?, introduzca y
. -
Lleve la controladora dañada al aviso DEL CARGADOR:
Si el controlador dañado está mostrando… Realice lo siguiente… El aviso del CARGADOR
Vaya a Quitar módulo de controlador.
Esperando devolución…
Pulse Ctrl-C y, a continuación, responda
y
cuando se le solicite.Solicitud del sistema o solicitud de contraseña
Retome o detenga el controlador dañado del controlador en buen estado:
storage failover takeover -ofnode impaired_node_name
Cuando el controlador dañado muestre esperando devolución…, pulse Ctrl-C y, a continuación, responda
y
.
Para apagar el controlador dañado, debe determinar el estado del controlador y, si es necesario, cambiar el controlador para que el controlador correcto siga sirviendo datos del almacenamiento del controlador dañado.
-
Si utiliza el cifrado de almacenamiento de NetApp, debe haber restablecido el MSID mediante las instrucciones de la sección "devolver una unidad FIPS o SED a modo sin protección" de "Información general del cifrado de NetApp con la interfaz de línea de comandos".
-
Debe dejar las fuentes de alimentación encendidas al final de este procedimiento para proporcionar alimentación a la controladora en buen estado.
-
Compruebe el estado de MetroCluster para determinar si el controlador dañado ha cambiado automáticamente al controlador en buen estado:
metrocluster show
-
En función de si se ha producido una conmutación automática, proceda según la siguiente tabla:
Si el controlador está dañado… Realice lo siguiente… Se ha cambiado automáticamente
Continúe con el próximo paso.
No se ha cambiado automáticamente
Realice una operación de conmutación de sitios planificada desde el controlador en buen estado:
metrocluster switchover
No se ha cambiado automáticamente, ha intentado efectuar una conmutación con el
metrocluster switchover
y se vetó la conmutaciónRevise los mensajes de veto y, si es posible, resuelva el problema e inténtelo de nuevo. Si no puede resolver el problema, póngase en contacto con el soporte técnico.
-
Resincronice los agregados de datos ejecutando el
metrocluster heal -phase aggregates
comando del clúster superviviente.controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
Si la curación es vetada, usted tiene la opción de reemitir el
metrocluster heal
con el-override-vetoes
parámetro. Si utiliza este parámetro opcional, el sistema anula cualquier vetoo suave que impida la operación de reparación. -
Compruebe que se ha completado la operación con el comando MetroCluster operation show.
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
Compruebe el estado de los agregados mediante
storage aggregate show
comando.controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
Repare los agregados raíz mediante el
metrocluster heal -phase root-aggregates
comando.mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
Si la curación es vetada, usted tiene la opción de reemitir el
metrocluster heal
comando con el parámetro -override-vetoes. Si utiliza este parámetro opcional, el sistema anula cualquier vetoo suave que impida la operación de reparación. -
Compruebe que la operación reparar se ha completado mediante el
metrocluster operation show
comando en el clúster de destino:mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
En el módulo del controlador dañado, desconecte las fuentes de alimentación.
Paso 2: Abra el módulo del controlador
Para acceder a los componentes del interior del controlador, primero debe extraer el módulo del controlador del sistema y, a continuación, retirar la cubierta del módulo del controlador.
-
Si usted no está ya conectado a tierra, correctamente tierra usted mismo.
-
Afloje el gancho y la correa de bucle que sujetan los cables al dispositivo de administración de cables y, a continuación, desconecte los cables del sistema y los SFP (si fuera necesario) del módulo del controlador, manteniendo un seguimiento del lugar en el que estaban conectados los cables.
Deje los cables en el dispositivo de administración de cables de manera que cuando vuelva a instalar el dispositivo de administración de cables, los cables estén organizados.
-
Retire y retire los dispositivos de administración de cables de los lados izquierdo y derecho del módulo del controlador.
-
Afloje el tornillo de ajuste manual del asa de leva del módulo del controlador.
Tornillo de apriete manual
Mango de leva
-
Tire del asa de leva hacia abajo y comience a sacar el módulo del controlador del chasis.
Asegúrese de que admite la parte inferior del módulo de la controladora cuando la deslice para sacarlo del chasis.
Paso 3: Sustituya o añada un módulo de almacenamiento en caché
Para sustituir o añadir un módulo de almacenamiento en caché denominado tarjeta PCIe M.2 de la etiqueta de la controladora, localice las ranuras del interior de la controladora y siga la secuencia específica de pasos.
Su sistema de almacenamiento debe cumplir ciertos criterios según su situación:
-
Debe tener el sistema operativo adecuado para el módulo de almacenamiento en caché que está instalando.
-
Debe admitir la capacidad de almacenamiento en caché.
-
Todos los demás componentes del sistema de almacenamiento deben funcionar correctamente; de lo contrario, debe comunicarse con el soporte técnico.
-
Localice el módulo de almacenamiento en caché que se encuentra en la parte posterior del módulo de la controladora y extráigalo.
-
Pulse la pestaña de liberación.
-
Extraiga el disipador de calor.
El sistema de almacenamiento viene con dos ranuras disponibles para el módulo de almacenamiento en caché y sólo una ranura está ocupada, de forma predeterminada.
-
-
Si va a añadir un módulo de almacenamiento en caché, vaya al siguiente paso; si va a sustituir el módulo de almacenamiento en caché, tire suavemente de él para extraerlo del alojamiento.
-
Alinee los bordes del módulo de almacenamiento en caché con el zócalo del alojamiento y, a continuación, empújelo suavemente en el zócalo.
-
Compruebe que el módulo de almacenamiento en caché está asentado completamente en el zócalo.
Si es necesario, extraiga el módulo de caché y vuelva a colocarlo en el zócalo.
-
Vuelva a colocar y empuje el disipador de calor hacia abajo para conectar el botón de bloqueo en la carcasa del módulo de caché.
-
Repita los pasos si tiene un segundo módulo de almacenamiento en caché. Cierre la cubierta del módulo del controlador, según sea necesario.
-
Paso 4: Vuelva a instalar el controlador
Después de sustituir un componente dentro del módulo del controlador, debe volver a instalar el módulo del controlador en el chasis del sistema y reiniciarlo en un estado en el que pueda ejecutar las pruebas de diagnóstico en el componente sustituido.
-
Alinee el extremo del módulo del controlador con la abertura del chasis y, a continuación, empuje suavemente el módulo del controlador hasta la mitad del sistema.
No inserte completamente el módulo de la controladora en el chasis hasta que se le indique hacerlo. -
Recuperar el sistema, según sea necesario.
Si ha quitado los convertidores de medios (QSFP o SFP), recuerde volver a instalarlos si está utilizando cables de fibra óptica.
-
Complete la reinstalación del módulo del controlador:
El módulo de la controladora comienza a arrancar tan pronto como se asienta completamente en el chasis. Esté preparado para interrumpir el proceso de arranque.
-
Con la palanca de leva en la posición abierta, empuje firmemente el módulo del controlador hasta que se ajuste al plano medio y esté completamente asentado y, a continuación, cierre la palanca de leva a la posición de bloqueo.
No ejerza una fuerza excesiva al deslizar el módulo del controlador hacia el chasis para evitar dañar los conectores. -
Apriete el tornillo de mano de la palanca de leva en la parte posterior del módulo del controlador.
-
Si aún no lo ha hecho, vuelva a instalar el dispositivo de administración de cables.
-
Conecte los cables al dispositivo de gestión de cables con la correa de gancho y lazo.
-
A medida que cada controlador inicia el arranque, pulse
Ctrl-C
para interrumpir el proceso de arranque cuando vea el mensajePress Ctrl-C for Boot Menu
. -
Seleccione la opción de arrancar en el modo de mantenimiento en el menú que se muestra.
-
Paso 5: Ejecute un diagnóstico de nivel de sistema
Después de instalar un nuevo módulo de almacenamiento en caché, debe ejecutar el diagnóstico.
Su sistema debe estar en el aviso DEL CARGADOR para iniciar los diagnósticos de nivel de sistema.
Todos los comandos de los procedimientos de diagnóstico se emiten desde la controladora en la que se sustituye el componente.
-
Si la controladora que se va a reparar no está en el símbolo del sistema del CARGADOR, siga estos pasos:
-
Seleccione la opción modo de mantenimiento en el menú que se muestra.
-
Después de que la controladora arranca en modo de mantenimiento, detenga la controladora:
halt
Tras emitir el comando, debe esperar hasta que el sistema se detenga en el símbolo del sistema del CARGADOR.
Durante el proceso de arranque, puede responder de forma segura y
para solicitar: -
-
En el aviso DEL CARGADOR, acceda a los controladores especiales diseñados específicamente para que los diagnósticos del sistema funcionen correctamente:
boot_diags
Durante el proceso de arranque, puede responder de forma segura
y
A las indicaciones hasta que aparezca el indicador del modo de mantenimiento (*>). -
Ejecute diagnósticos en el módulo de almacenamiento en caché:
sldiag device run -dev fcache
-
Verifique que no haya problemas de hardware derivados de la sustitución del módulo de almacenamiento en caché:
sldiag device status -dev fcache -long -state failed
Los diagnósticos de nivel de sistema le devuelven al prompt si no hay errores de prueba o indican el estado completo de los errores resultantes de la prueba del componente.
-
Proceda según el resultado del paso anterior:
Si el diagnóstico del sistema prueba… Realice lo siguiente… Se completaron sin fallos
-
Borre los registros de estado:
sldiag device clearstatus
-
Compruebe que se ha borrado el registro:
sldiag device status
Se muestra la siguiente respuesta predeterminada:
SLDIAG: No hay mensajes de registro.
-
Salir del modo de mantenimiento:
halt
La controladora muestra el aviso del CARGADOR.
-
Arranque la controladora desde el símbolo del sistema del CARGADOR:
bye
-
Devolver a la controladora a su funcionamiento normal:
Si la controladora se encuentra en… Realice lo siguiente… Un par de alta disponibilidad
Realice un aporte atrás:
storage failover giveback -ofnode replacement_node_name
Si ha deshabilitado la devolución automática, vuelva a habilitarla con el comando Storage Failover modify. Una configuración MetroCluster de dos nodos
Continúe con el próximo paso. El procedimiento de conmutación de estado del MetroCluster se lleva a cabo en la siguiente tarea del proceso de sustitución.
Una configuración independiente
Continúe con el próximo paso. No se requiere ninguna acción. Ha completado el diagnóstico de nivel del sistema.
Se produjeron algunos fallos en las pruebas
Determine la causa del problema:
-
Salir del modo de mantenimiento:
halt
Después de emitir el comando, espere hasta que el sistema se detenga en el símbolo del sistema del CARGADOR.
-
Apague o deje las fuentes de alimentación en función del número de módulos de controladora que haya en el chasis:
-
Si tiene dos módulos de controladora en el chasis, deje las fuentes de alimentación encendidas para proporcionar alimentación al otro módulo de controladora.
-
Si tiene un módulo de controlador en el chasis, apague las fuentes de alimentación y desenchúfelas de las fuentes de alimentación.
-
-
Compruebe que ha observado todos los aspectos identificados a la hora de ejecutar diagnósticos de nivel de sistema, que los cables estén conectados de forma segura y que los componentes de hardware estén instalados correctamente en el sistema de almacenamiento.
-
Inicie el módulo del controlador que está realizando el mantenimiento, interrumpiendo el arranque pulsando
Ctrl-C
Cuando se le solicite acceder al menú Inicio:-
Si tiene dos módulos de controladora en el chasis, coloque a fondo el módulo de controladora que va a mantener en el chasis.
El módulo del controlador se arranca cuando está completamente asentado.
-
Si tiene un módulo de controladora en el chasis, conecte las fuentes de alimentación y, a continuación, enciéndalas.
-
-
Seleccione Boot to maintenance mode (Inicio al modo de mantenimiento) en el menú.
-
Para salir del modo de mantenimiento, introduzca el siguiente comando:
halt
Después de emitir el comando, espere hasta que el sistema se detenga en el símbolo del sistema del CARGADOR.
-
Vuelva a ejecutar la prueba de diagnóstico de nivel del sistema.
-
Paso 6: Vuelva a cambiar los agregados en una configuración MetroCluster de dos nodos
Una vez que haya completado el reemplazo de FRU en una configuración de MetroCluster de dos nodos, podrá llevar a cabo la operación de conmutación de estado de MetroCluster. De este modo, la configuración vuelve a su estado operativo normal, con las máquinas virtuales de almacenamiento (SVM) sincronizada en el sitio anteriormente afectado que ahora están activas y sirviendo datos de los pools de discos locales.
Esta tarea solo se aplica a configuraciones MetroCluster de dos nodos.
-
Compruebe que todos los nodos estén en el
enabled
provincia:metrocluster node show
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A controller_A_1 configured enabled heal roots completed cluster_B controller_B_1 configured enabled waiting for switchback recovery 2 entries were displayed.
-
Compruebe que la resincronización se haya completado en todas las SVM:
metrocluster vserver show
-
Compruebe que las migraciones LIF automáticas que realizan las operaciones de reparación se han completado correctamente:
metrocluster check lif show
-
Lleve a cabo la conmutación de estado mediante el
metrocluster switchback
comando desde cualquier nodo del clúster superviviente. -
Compruebe que la operación de conmutación de estado ha finalizado:
metrocluster show
La operación de conmutación de estado ya está en ejecución cuando un clúster está en el
waiting-for-switchback
provincia:cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured switchover Remote: cluster_A configured waiting-for-switchback
La operación de conmutación de estado se completa cuando los clústeres están en el
normal
estado:cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured normal Remote: cluster_A configured normal
Si una conmutación de regreso tarda mucho tiempo en terminar, puede comprobar el estado de las líneas base en curso utilizando el
metrocluster config-replication resync-status show
comando. -
Restablecer cualquier configuración de SnapMirror o SnapVault.
Paso 7: Complete el proceso de reemplazo
Devuelva la pieza que ha fallado a NetApp, como se describe en las instrucciones de RMA que se suministran con el kit. Consulte "Retorno de artículo sustituciones" para obtener más información.