Intercambia en caliente un módulo de E/S - FAS50
Puedes intercambiar en caliente un módulo de E/S Ethernet en tu sistema de almacenamiento FAS50 si un módulo falla y tu sistema de almacenamiento cumple todos los requisitos de versión de ONTAP.
Para intercambiar en caliente un módulo de E/S, asegúrate de que tu sistema de almacenamiento cumple los requisitos de la versión de ONTAP, prepara tu sistema de almacenamiento y el módulo de E/S, intercambia en caliente el módulo averiado, pon en línea el módulo de reemplazo, restaura el sistema de almacenamiento a su funcionamiento normal y devuelve el módulo averiado a NetApp.
-
El intercambio en caliente del módulo de E/S significa que no tienes que realizar una toma de control manual antes de reemplazar el módulo de E/S averiado.
-
Aplica los comandos al controlador y a la ranura de E/S correctos cuando estés haciendo el intercambio en caliente del módulo de E/S:
-
El controlador deteriorado es el controlador en el que estás intercambiando en caliente el módulo de E/S.
-
El controlador saludable es el socio HA del controlador dañado.
-
-
Puedes encender los LED de ubicación (azules) del sistema de almacenamiento para ayudarte a localizar físicamente el sistema de almacenamiento afectado. Inicia sesión en el BMC usando SSH y escribe el comando
system location-led on.Un sistema de almacenamiento tiene tres LED de ubicación: Uno en el panel de visualización del operador y otro en cada controlador. Los LED de ubicación permanecen encendidos durante 30 minutos.
Puede desactivarlos introduciendo
system location-led offel comando. Si no está seguro de si los LED están encendidos o apagados, puede comprobar su estado introduciendosystem location-led showel comando.
Paso 1: Asegúrese de que el sistema de almacenamiento cumpla con los requisitos del procedimiento
Para usar este procedimiento, tu sistema de almacenamiento debe estar ejecutando ONTAP 9.17.1 o una versión posterior, y tu sistema de almacenamiento debe cumplir todos los requisitos para la versión de ONTAP que esté ejecutando.
|
|
Si tu sistema de almacenamiento no está ejecutando ONTAP 9.17.1 o una versión posterior, o no cumple con todos los requisitos para la versión de ONTAP que está ejecutando tu sistema de almacenamiento, no puedes usar este procedimiento, debes usar el "procedimiento para reemplazar un módulo de E/S". |
-
Estás intercambiando en caliente un módulo de E/S de clúster y HA averiado en la ranura 4 por un módulo de E/S equivalente. No puedes cambiar el tipo de módulo de E/S.
-
El controlador con el clúster y el módulo de E/S de alta disponibilidad que han fallado (el controlador dañado) ya debe haber tomado el control del controlador asociado sano. La toma de control automática debería haberse producido si el módulo de E/S ha fallado.
Para clústeres de dos nodos, el sistema de almacenamiento no puede discernir qué controlador tiene el módulo de E/S que ha fallado, por lo que cualquiera de los controladores podría iniciar la toma de control. El intercambio en caliente solo se admite cuando el controlador con el módulo de E/S que ha fallado (el controlador dañado) ha tomado el control del controlador sano. El intercambio en caliente del módulo de E/S es la única forma de recuperarse sin una interrupción.
Puede verificar que el controlador dañado tomó control exitosamente del controlador saludable ingresando el
storage failover showdominio.Si no está seguro de qué controlador tiene el módulo de E/S fallido, comuníquese con "Soporte de NetApp" .
-
La configuración de su sistema de almacenamiento debe tener solo un clúster y un módulo de E/S de HA ubicados en la ranura 4, no dos clústeres y módulos de E/S de HA.
-
Su sistema de almacenamiento debe ser una configuración de clúster de dos nodos (conmutados o sin conmutador).
-
El resto de componentes del sistema de almacenamiento deben funcionar correctamente. De lo contrario, póngase en contacto "Soporte de NetApp" antes de continuar con este procedimiento.
-
Estás intercambiando en caliente un módulo de E/S Ethernet en cualquier ranura que tenga cualquier combinación de puertos usados para cluster, HA y cliente con un módulo de E/S equivalente. No puedes cambiar el tipo de módulo de E/S.
Los módulos de E/S Ethernet con puertos usados para almacenamiento o MetroCluster no son intercambiables en caliente.
-
Tu sistema de almacenamiento (configuración de clúster sin switches o con switches) puede tener cualquier número de nodos compatibles con tu sistema de almacenamiento.
-
Todos los nodos del clúster deben estar ejecutando la misma versión de ONTAP (ONTAP 9.18.1GA o posterior) o estar ejecutando diferentes niveles de parche de la misma versión de ONTAP.
Si los nodos de tu clúster están ejecutando diferentes versiones de ONTAP, esto se considera un clúster de versión mixta y no se admite el intercambio en caliente de un módulo de I/O.
-
Los controladores de tu sistema de almacenamiento pueden estar en cualquiera de los siguientes estados:
-
Ambos controladores pueden estar en funcionamiento y ejecutando E/S (sirviendo datos).
-
Cualquiera de los controladores puede estar en un estado de toma de control si la toma de control fue causada por el módulo de I/O que falló y los controladores, por lo demás, funcionan correctamente.
En determinadas situaciones, ONTAP puede realizar una toma de control automática de cualquiera de los controladores debido al módulo de I/O averiado. Por ejemplo, si el módulo de I/O averiado contenía todos los puertos de cluster (todos los enlaces de cluster de ese controlador se caen) ONTAP realiza una toma de control automática.
-
-
El resto de componentes del sistema de almacenamiento deben funcionar correctamente. De lo contrario, póngase en contacto "Soporte de NetApp" antes de continuar con este procedimiento.
Paso 2: prepara el sistema de almacenamiento y la ranura del módulo de E/S
Prepara el sistema de almacenamiento y la ranura del módulo de E/S para que sea seguro retirar el módulo de E/S averiado:
-
Puesta a tierra apropiadamente usted mismo.
-
Desconecta los cables del módulo de E/S averiado.
Asegúrate de etiquetar los cables para que puedas volver a conectarlos a los mismos puertos más adelante en este procedimiento.
El módulo de E/S debe estar averiado (los puertos deben estar en estado de enlace caído); sin embargo, si los enlaces siguen funcionando y contienen el último puerto de clúster en funcionamiento, al desenchufar los cables se desencadena una toma de control automática.
Espera cinco minutos después de desenchufar los cables para asegurarte de que se haya completado cualquier toma de control automática o conmutación por error de LIF antes de continuar con este procedimiento.
-
Si AutoSupport está habilitado, elimine la creación automática de casos invocando un mensaje de AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=<number of hours down>hPor ejemplo, el siguiente mensaje de AutoSupport suprime la creación automática de casos durante dos horas:
node2::> system node autosupport invoke -node * -type all -message MAINT=2h -
Según sea necesario para la versión de ONTAP que está ejecutando tu sistema de almacenamiento y el estado de los controladores, desactiva la toma de control automática:
Versión de ONTAP Si… Realice lo siguiente… 9.17.1 o 9.18.1RC
Si el controlador dañado tomó el control automáticamente del controlador sano
Desactivar devolución automática:
-
Introduce el siguiente comando desde la consola del controlador dañado
storage failover modify -node local -auto-giveback false -
Ingresar
ycuando vea el mensaje "¿Desea desactivar la devolución automática?"
9.18.1GA o posterior
Si cualquiera de los controladores tomó el control de su pareja automáticamente
Desactivar devolución automática:
-
Introduce el siguiente comando desde la consola del controlador que tomó el control de su pareja:
storage failover modify -node local -auto-giveback false -
Ingresar
ycuando vea el mensaje "¿Desea desactivar la devolución automática?"
9.18.1GA o posterior
Ambos controladores están en funcionamiento y ejecutando E/S (sirviendo datos)
Vaya al paso siguiente.
-
-
Prepara el módulo de E/S averiado para retirarlo, poniéndolo fuera de servicio y apagándolo:
-
Introduzca el siguiente comando:
system controller slot module remove -node impaired_node_name -slot slot_number -
Ingresar
ycuando veas el mensaje ¿Quieres continuar?Por ejemplo, el siguiente comando prepara el módulo que ha fallado en la ranura 4 del nodo 2 (el controlador dañado) para su extracción y muestra un mensaje que indica que es seguro extraerlo:
node2::> system controller slot module remove -node node2 -slot 4 Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered off for removal. Do you want to continue? {y|n}: y The module has been successfully removed from service and powered off. It can now be safely removed. -
-
Verifica que el módulo de E/S averiado esté apagado:
system controller slot module showLa salida debería mostrar
powered-offen lastatuscolumna para el módulo que ha fallado y su número de ranura.
Paso 3: intercambio en caliente del módulo de E/S averiado
Intercambia en caliente el módulo de E/S averiado por un módulo de E/S equivalente:
-
Si usted no está ya conectado a tierra, correctamente tierra usted mismo.
-
Retira el módulo de E/S averiado del controlador con problemas:
Gire el tornillo de apriete manual del módulo de E/S hacia la izquierda para aflojarlo.
Extraiga el módulo de E/S del controlador utilizando la pestaña de la etiqueta del puerto a la izquierda y el tornillo de mariposa a la derecha.
-
Instala el módulo de E/S de repuesto:
-
Alinee el módulo de E/S con los bordes de la ranura.
-
Empuje suavemente el módulo de E/S hasta el fondo de la ranura, asegurándose de colocarlo correctamente en el conector.
Puede utilizar la pestaña de la izquierda y el tornillo de mariposa de la derecha para empujar el módulo de E/S.
-
Gire el tornillo de mariposa hacia la derecha para apretarlo.
-
-
Conecta el módulo de E/S de repuesto.
Paso 4: poner en línea el módulo de E/S de sustitución
Pon en línea el módulo de E/S de reemplazo, verifica que los puertos del módulo de E/S se hayan inicializado correctamente, verifica que la ranura esté encendida y luego verifica que el módulo de E/S esté en línea y reconocido.
Después de que el módulo de E/S es reemplazado y los puertos vuelven a un estado saludable, los LIFs se revierten al módulo de E/S reemplazado.
-
Pon en línea el módulo de E/S de recambio:
-
Introduzca el siguiente comando:
system controller slot module insert -node impaired_node_name -slot slot_number -
Ingresar
yCuando veas el mensaje "¿Quieres continuar?"La salida debe confirmar que el módulo de E/S se puso en línea correctamente (encendido, inicializado y puesto en servicio).
Por ejemplo, el siguiente comando pone en línea la ranura 4 del nodo 2 (el controlador dañado) y muestra un mensaje que indica que el proceso fue exitoso:
node2::> system controller slot module insert -node node2 -slot 4 Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered on and initialized. Do you want to continue? {y|n}: `y` The module has been successfully powered on, initialized and placed into service. -
-
Verifica que cada puerto del módulo de E/S se haya inicializado correctamente:
-
Ingrese el siguiente comando desde la consola del controlador dañado:
event log show -event *hotplug.init*Puede que las actualizaciones necesarias de firmware y la inicialización del puerto tarden varios minutos. La salida debería mostrar uno o más eventos hotplug.init.success EMS que indican que cada puerto del módulo de E/S se inició con éxito.
Por ejemplo, la siguiente salida muestra que la inicialización fue exitosa para los puertos de E/S e4b y e4a:
node2::> event log show -event *hotplug.init* Time Node Severity Event ------------------- ---------------- ------------- --------------------------- 7/11/2025 16:04:06 node2 NOTICE hotplug.init.success: Initialization of ports "e4b" in slot 4 succeeded 7/11/2025 16:04:06 node2 NOTICE hotplug.init.success: Initialization of ports "e4a" in slot 4 succeeded 2 entries were displayed.
-
Si la inicialización del puerto falla, revisa el registro de EMS para ver los siguientes pasos a seguir.
-
-
Verifica que la ranura del módulo de E/S esté encendida y lista para funcionar:
system controller slot module showLa salida debe mostrar el estado de la ranura como
powered-ony por lo tanto lista para el funcionamiento del módulo de E/S. -
Verifica que el módulo de E/S está en línea y reconocido.
Ingrese el comando desde la consola del controlador dañado:
system controller config show -node local -slot slot_numberSi el módulo de E/S se puso en línea correctamente y se reconoce, la salida muestra información del módulo de E/S, incluida la información del puerto para la ranura.
Por ejemplo, deberías ver una salida similar a la siguiente para un módulo de E/S en la ranura 4:
node2::> system controller config show -node local -slot 4 Node: node2 Sub- Device/ Slot slot Information ---- ---- ----------------------------- 4 - Dual 40G/100G Ethernet Controller CX6-DX e4a MAC Address: d0:39:ea:59:69:74 (auto-100g_cr4-fd-up) QSFP Vendor: CISCO-BIZLINK QSFP Part Number: L45593-D218-D10 QSFP Serial Number: LCC2807GJFM-B e4b MAC Address: d0:39:ea:59:69:75 (auto-100g_cr4-fd-up) QSFP Vendor: CISCO-BIZLINK QSFP Part Number: L45593-D218-D10 QSFP Serial Number: LCC2809G26F-A Device Type: CX6-DX PSID(NAP0000000027) Firmware Version: 22.44.1700 Part Number: 111-05341 Hardware Revision: 20 Serial Number: 032403001370
Paso 5: Restaurar el sistema de almacenamiento a su funcionamiento normal
Restaura el funcionamiento normal de tu sistema de almacenamiento devolviendo el almacenamiento al controlador del que se hizo la toma de control (si es necesario), restaurando la toma de control automática (si es necesario), verificando que los LIF estén en sus puertos de origen y volviendo a habilitar la creación automática de casos en AutoSupport.
-
Según sea necesario para la versión de ONTAP que está ejecutando tu sistema de almacenamiento y el estado de los controladores, devuelve el almacenamiento y restaura la toma de control automática en el controlador que fue tomado:
Versión de ONTAP Si… Realice lo siguiente… 9.17.1 o 9.18.1RC
Si el controlador dañado tomó el control automáticamente del controlador sano
-
Devuelve el controlador sano a su funcionamiento normal devolviéndole su almacenamiento:
storage failover giveback -ofnode healthy_node_name -
Restaura la devolución automática desde la consola del controlador afectado:
storage failover modify -node local -auto-giveback true
9.18.1GA o posterior
Si cualquiera de los controladores tomó el control de su pareja automáticamente
-
Devuelve el controlador que fue tomado a su funcionamiento normal devolviéndole su almacenamiento:
storage failover giveback -ofnode controller that was taken over_name -
Restaura la devolución automática desde la consola del controlador que fue tomado:
storage failover modify -node local -auto-giveback true
9.18.1GA o posterior
Ambos controladores están en funcionamiento y ejecutando E/S (sirviendo datos)
Vaya al paso siguiente.
-
-
Compruebe que las interfaces lógicas están reportando a sus puertos y servidores domésticos:
network interface show -is-home falseSi alguno de los LIF se muestra como false, este se revierte a sus puertos principales:
network interface revert -vserver * -lif * -
Si AutoSupport está habilitado, restaure la creación automática de casos:
system node autosupport invoke -node * -type all -message MAINT=end
Paso 6: Devuelva la pieza que falló a NetApp
Devuelva la pieza que ha fallado a NetApp, como se describe en las instrucciones de RMA que se suministran con el kit. Consulte "Devolución de piezas y sustituciones" la página para obtener más información.