Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Intercambia en caliente un módulo de E/S - FAS50

Colaboradores netapp-lisa

Puedes intercambiar en caliente un módulo de E/S Ethernet en tu sistema de almacenamiento FAS50 si un módulo falla y tu sistema de almacenamiento cumple todos los requisitos de versión de ONTAP.

Para intercambiar en caliente un módulo de E/S, asegúrate de que tu sistema de almacenamiento cumple los requisitos de la versión de ONTAP, prepara tu sistema de almacenamiento y el módulo de E/S, intercambia en caliente el módulo averiado, pon en línea el módulo de reemplazo, restaura el sistema de almacenamiento a su funcionamiento normal y devuelve el módulo averiado a NetApp.

Acerca de esta tarea
  • El intercambio en caliente del módulo de E/S significa que no tienes que realizar una toma de control manual antes de reemplazar el módulo de E/S averiado.

  • Aplica los comandos al controlador y a la ranura de E/S correctos cuando estés haciendo el intercambio en caliente del módulo de E/S:

    • El controlador deteriorado es el controlador en el que estás intercambiando en caliente el módulo de E/S.

    • El controlador saludable es el socio HA del controlador dañado.

  • Puedes encender los LED de ubicación (azules) del sistema de almacenamiento para ayudarte a localizar físicamente el sistema de almacenamiento afectado. Inicia sesión en el BMC usando SSH y escribe el comando system location-led on.

    Un sistema de almacenamiento tiene tres LED de ubicación: Uno en el panel de visualización del operador y otro en cada controlador. Los LED de ubicación permanecen encendidos durante 30 minutos.

    Puede desactivarlos introduciendo system location-led off el comando. Si no está seguro de si los LED están encendidos o apagados, puede comprobar su estado introduciendo system location-led show el comando.

Paso 1: Asegúrese de que el sistema de almacenamiento cumpla con los requisitos del procedimiento

Para usar este procedimiento, tu sistema de almacenamiento debe estar ejecutando ONTAP 9.17.1 o una versión posterior, y tu sistema de almacenamiento debe cumplir todos los requisitos para la versión de ONTAP que esté ejecutando.

Nota Si tu sistema de almacenamiento no está ejecutando ONTAP 9.17.1 o una versión posterior, o no cumple con todos los requisitos para la versión de ONTAP que está ejecutando tu sistema de almacenamiento, no puedes usar este procedimiento, debes usar el "procedimiento para reemplazar un módulo de E/S".
ONTAP 9.17.1 o 9.18.1RC
  • Estás intercambiando en caliente un módulo de E/S de clúster y HA averiado en la ranura 4 por un módulo de E/S equivalente. No puedes cambiar el tipo de módulo de E/S.

  • El controlador con el clúster y el módulo de E/S de alta disponibilidad que han fallado (el controlador dañado) ya debe haber tomado el control del controlador asociado sano. La toma de control automática debería haberse producido si el módulo de E/S ha fallado.

    Para clústeres de dos nodos, el sistema de almacenamiento no puede discernir qué controlador tiene el módulo de E/S que ha fallado, por lo que cualquiera de los controladores podría iniciar la toma de control. El intercambio en caliente solo se admite cuando el controlador con el módulo de E/S que ha fallado (el controlador dañado) ha tomado el control del controlador sano. El intercambio en caliente del módulo de E/S es la única forma de recuperarse sin una interrupción.

    Puede verificar que el controlador dañado tomó control exitosamente del controlador saludable ingresando el storage failover show dominio.

    Si no está seguro de qué controlador tiene el módulo de E/S fallido, comuníquese con "Soporte de NetApp" .

  • La configuración de su sistema de almacenamiento debe tener solo un clúster y un módulo de E/S de HA ubicados en la ranura 4, no dos clústeres y módulos de E/S de HA.

  • Su sistema de almacenamiento debe ser una configuración de clúster de dos nodos (conmutados o sin conmutador).

  • El resto de componentes del sistema de almacenamiento deben funcionar correctamente. De lo contrario, póngase en contacto "Soporte de NetApp" antes de continuar con este procedimiento.

ONTAP 9.18.1GA o posterior
  • Estás intercambiando en caliente un módulo de E/S Ethernet en cualquier ranura que tenga cualquier combinación de puertos usados para cluster, HA y cliente con un módulo de E/S equivalente. No puedes cambiar el tipo de módulo de E/S.

    Los módulos de E/S Ethernet con puertos usados para almacenamiento o MetroCluster no son intercambiables en caliente.

  • Tu sistema de almacenamiento (configuración de clúster sin switches o con switches) puede tener cualquier número de nodos compatibles con tu sistema de almacenamiento.

  • Todos los nodos del clúster deben estar ejecutando la misma versión de ONTAP (ONTAP 9.18.1GA o posterior) o estar ejecutando diferentes niveles de parche de la misma versión de ONTAP.

    Si los nodos de tu clúster están ejecutando diferentes versiones de ONTAP, esto se considera un clúster de versión mixta y no se admite el intercambio en caliente de un módulo de I/O.

  • Los controladores de tu sistema de almacenamiento pueden estar en cualquiera de los siguientes estados:

    • Ambos controladores pueden estar en funcionamiento y ejecutando E/S (sirviendo datos).

    • Cualquiera de los controladores puede estar en un estado de toma de control si la toma de control fue causada por el módulo de I/O que falló y los controladores, por lo demás, funcionan correctamente.

      En determinadas situaciones, ONTAP puede realizar una toma de control automática de cualquiera de los controladores debido al módulo de I/O averiado. Por ejemplo, si el módulo de I/O averiado contenía todos los puertos de cluster (todos los enlaces de cluster de ese controlador se caen) ONTAP realiza una toma de control automática.

  • El resto de componentes del sistema de almacenamiento deben funcionar correctamente. De lo contrario, póngase en contacto "Soporte de NetApp" antes de continuar con este procedimiento.

Paso 2: prepara el sistema de almacenamiento y la ranura del módulo de E/S

Prepara el sistema de almacenamiento y la ranura del módulo de E/S para que sea seguro retirar el módulo de E/S averiado:

Pasos
  1. Puesta a tierra apropiadamente usted mismo.

  2. Desconecta los cables del módulo de E/S averiado.

    Asegúrate de etiquetar los cables para que puedas volver a conectarlos a los mismos puertos más adelante en este procedimiento.

    Nota

    El módulo de E/S debe estar averiado (los puertos deben estar en estado de enlace caído); sin embargo, si los enlaces siguen funcionando y contienen el último puerto de clúster en funcionamiento, al desenchufar los cables se desencadena una toma de control automática.

    Espera cinco minutos después de desenchufar los cables para asegurarte de que se haya completado cualquier toma de control automática o conmutación por error de LIF antes de continuar con este procedimiento.

  3. Si AutoSupport está habilitado, elimine la creación automática de casos invocando un mensaje de AutoSupport:

    system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

    Por ejemplo, el siguiente mensaje de AutoSupport suprime la creación automática de casos durante dos horas:

    node2::> system node autosupport invoke -node * -type all -message MAINT=2h

  4. Según sea necesario para la versión de ONTAP que está ejecutando tu sistema de almacenamiento y el estado de los controladores, desactiva la toma de control automática:

    Versión de ONTAP Si…​ Realice lo siguiente…​

    9.17.1 o 9.18.1RC

    Si el controlador dañado tomó el control automáticamente del controlador sano

    Desactivar devolución automática:

    1. Introduce el siguiente comando desde la consola del controlador dañado

      storage failover modify -node local -auto-giveback false

    2. Ingresar y cuando vea el mensaje "¿Desea desactivar la devolución automática?"

    9.18.1GA o posterior

    Si cualquiera de los controladores tomó el control de su pareja automáticamente

    Desactivar devolución automática:

    1. Introduce el siguiente comando desde la consola del controlador que tomó el control de su pareja:

      storage failover modify -node local -auto-giveback false

    2. Ingresar y cuando vea el mensaje "¿Desea desactivar la devolución automática?"

    9.18.1GA o posterior

    Ambos controladores están en funcionamiento y ejecutando E/S (sirviendo datos)

    Vaya al paso siguiente.

  5. Prepara el módulo de E/S averiado para retirarlo, poniéndolo fuera de servicio y apagándolo:

    1. Introduzca el siguiente comando:

      system controller slot module remove -node impaired_node_name -slot slot_number

    2. Ingresar y cuando veas el mensaje ¿Quieres continuar?

      Por ejemplo, el siguiente comando prepara el módulo que ha fallado en la ranura 4 del nodo 2 (el controlador dañado) para su extracción y muestra un mensaje que indica que es seguro extraerlo:

    node2::> system controller slot module remove -node node2 -slot 4
    
    Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered off for removal.
    
    Do you want to continue? {y|n}: y
    
    The module has been successfully removed from service and powered off. It can now be safely removed.
  6. Verifica que el módulo de E/S averiado esté apagado:

    system controller slot module show

    La salida debería mostrar powered-off en la status columna para el módulo que ha fallado y su número de ranura.

Paso 3: intercambio en caliente del módulo de E/S averiado

Intercambia en caliente el módulo de E/S averiado por un módulo de E/S equivalente:

Pasos
  1. Si usted no está ya conectado a tierra, correctamente tierra usted mismo.

  2. Retira el módulo de E/S averiado del controlador con problemas:

    Clúster de intercambio en caliente y módulo de E/S ha en la ranura 4
    Número de llamada 1

    Gire el tornillo de apriete manual del módulo de E/S hacia la izquierda para aflojarlo.

    Número de llamada 2

    Extraiga el módulo de E/S del controlador utilizando la pestaña de la etiqueta del puerto a la izquierda y el tornillo de mariposa a la derecha.

  3. Instala el módulo de E/S de repuesto:

    1. Alinee el módulo de E/S con los bordes de la ranura.

    2. Empuje suavemente el módulo de E/S hasta el fondo de la ranura, asegurándose de colocarlo correctamente en el conector.

      Puede utilizar la pestaña de la izquierda y el tornillo de mariposa de la derecha para empujar el módulo de E/S.

    3. Gire el tornillo de mariposa hacia la derecha para apretarlo.

  4. Conecta el módulo de E/S de repuesto.

Paso 4: poner en línea el módulo de E/S de sustitución

Pon en línea el módulo de E/S de reemplazo, verifica que los puertos del módulo de E/S se hayan inicializado correctamente, verifica que la ranura esté encendida y luego verifica que el módulo de E/S esté en línea y reconocido.

Acerca de esta tarea

Después de que el módulo de E/S es reemplazado y los puertos vuelven a un estado saludable, los LIFs se revierten al módulo de E/S reemplazado.

Pasos
  1. Pon en línea el módulo de E/S de recambio:

    1. Introduzca el siguiente comando:

      system controller slot module insert -node impaired_node_name -slot slot_number

    2. Ingresar y Cuando veas el mensaje "¿Quieres continuar?"

      La salida debe confirmar que el módulo de E/S se puso en línea correctamente (encendido, inicializado y puesto en servicio).

      Por ejemplo, el siguiente comando pone en línea la ranura 4 del nodo 2 (el controlador dañado) y muestra un mensaje que indica que el proceso fue exitoso:

    node2::> system controller slot module insert -node node2 -slot 4
    
    Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered on and initialized.
    
    Do you want to continue? {y|n}: `y`
    
    The module has been successfully powered on, initialized and placed into service.
  2. Verifica que cada puerto del módulo de E/S se haya inicializado correctamente:

    1. Ingrese el siguiente comando desde la consola del controlador dañado:

      event log show -event *hotplug.init*

      Nota Puede que las actualizaciones necesarias de firmware y la inicialización del puerto tarden varios minutos.

      La salida debería mostrar uno o más eventos hotplug.init.success EMS que indican que cada puerto del módulo de E/S se inició con éxito.

      Por ejemplo, la siguiente salida muestra que la inicialización fue exitosa para los puertos de E/S e4b y e4a:

    node2::> event log show -event *hotplug.init*
    
    Time                Node             Severity      Event
    
    ------------------- ---------------- ------------- ---------------------------
    
    7/11/2025 16:04:06  node2      NOTICE        hotplug.init.success: Initialization of ports "e4b" in slot 4 succeeded
    
    7/11/2025 16:04:06  node2      NOTICE        hotplug.init.success: Initialization of ports "e4a" in slot 4 succeeded
    
    2 entries were displayed.
    1. Si la inicialización del puerto falla, revisa el registro de EMS para ver los siguientes pasos a seguir.

  3. Verifica que la ranura del módulo de E/S esté encendida y lista para funcionar:

    system controller slot module show

    La salida debe mostrar el estado de la ranura como powered-on y por lo tanto lista para el funcionamiento del módulo de E/S.

  4. Verifica que el módulo de E/S está en línea y reconocido.

    Ingrese el comando desde la consola del controlador dañado:

    system controller config show -node local -slot slot_number

    Si el módulo de E/S se puso en línea correctamente y se reconoce, la salida muestra información del módulo de E/S, incluida la información del puerto para la ranura.

    Por ejemplo, deberías ver una salida similar a la siguiente para un módulo de E/S en la ranura 4:

    node2::> system controller config show -node local -slot 4
    
    Node: node2
    Sub- Device/
    Slot slot Information
    ---- ---- -----------------------------
       4    - Dual 40G/100G Ethernet Controller CX6-DX
                      e4a MAC Address: d0:39:ea:59:69:74 (auto-100g_cr4-fd-up)
                              QSFP Vendor:        CISCO-BIZLINK
                              QSFP Part Number:   L45593-D218-D10
                              QSFP Serial Number: LCC2807GJFM-B
                      e4b MAC Address: d0:39:ea:59:69:75 (auto-100g_cr4-fd-up)
                              QSFP Vendor:        CISCO-BIZLINK
                              QSFP Part Number:   L45593-D218-D10
                              QSFP Serial Number: LCC2809G26F-A
                      Device Type:        CX6-DX PSID(NAP0000000027)
                      Firmware Version:   22.44.1700
                      Part Number:        111-05341
                      Hardware Revision:  20
                      Serial Number:      032403001370

Paso 5: Restaurar el sistema de almacenamiento a su funcionamiento normal

Restaura el funcionamiento normal de tu sistema de almacenamiento devolviendo el almacenamiento al controlador del que se hizo la toma de control (si es necesario), restaurando la toma de control automática (si es necesario), verificando que los LIF estén en sus puertos de origen y volviendo a habilitar la creación automática de casos en AutoSupport.

Pasos
  1. Según sea necesario para la versión de ONTAP que está ejecutando tu sistema de almacenamiento y el estado de los controladores, devuelve el almacenamiento y restaura la toma de control automática en el controlador que fue tomado:

    Versión de ONTAP Si…​ Realice lo siguiente…​

    9.17.1 o 9.18.1RC

    Si el controlador dañado tomó el control automáticamente del controlador sano

    1. Devuelve el controlador sano a su funcionamiento normal devolviéndole su almacenamiento:

      storage failover giveback -ofnode healthy_node_name

    2. Restaura la devolución automática desde la consola del controlador afectado:

      storage failover modify -node local -auto-giveback true

    9.18.1GA o posterior

    Si cualquiera de los controladores tomó el control de su pareja automáticamente

    1. Devuelve el controlador que fue tomado a su funcionamiento normal devolviéndole su almacenamiento:

      storage failover giveback -ofnode controller that was taken over_name

    2. Restaura la devolución automática desde la consola del controlador que fue tomado:

      storage failover modify -node local -auto-giveback true

    9.18.1GA o posterior

    Ambos controladores están en funcionamiento y ejecutando E/S (sirviendo datos)

    Vaya al paso siguiente.

  2. Compruebe que las interfaces lógicas están reportando a sus puertos y servidores domésticos: network interface show -is-home false

    Si alguno de los LIF se muestra como false, este se revierte a sus puertos principales: network interface revert -vserver * -lif *

  3. Si AutoSupport está habilitado, restaure la creación automática de casos:

    system node autosupport invoke -node * -type all -message MAINT=end

Paso 6: Devuelva la pieza que falló a NetApp

Devuelva la pieza que ha fallado a NetApp, como se describe en las instrucciones de RMA que se suministran con el kit. Consulte "Devolución de piezas y sustituciones" la página para obtener más información.