Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Reemplazar un conmutador de clúster NVIDIA SN2100

Colaboradores netapp-yvonneo netapp-jolieg

Siga este procedimiento para reemplazar un conmutador NVIDIA SN2100 defectuoso en una red de clúster. Este es un procedimiento no disruptivo (NDU).

Requisitos de revisión

Infraestructura de clúster y red existente

Asegúrese de que:

  • Se verifica que los clústeres existentes son completamente funcionales, con al menos un conmutador de clúster totalmente conectado.

  • Todos los puertos del clúster están activos.

  • Todas las interfaces lógicas del clúster (LIF) están activas y en sus puertos de inicio.

  • El ONTAP cluster ping-cluster -node node1 El comando indica que la conectividad básica y la comunicación superior a PMTU se realizan correctamente en todas las rutas.

Interruptor de repuesto NVIDIA SN2100

Asegúrese de que:

  • La conectividad de la red de gestión en el switch de reemplazo funciona correctamente.

  • El acceso a la consola para el interruptor de repuesto ya está habilitado.

  • Las conexiones de nodo son los puertos swp1 a swp14.

  • Todos los puertos Inter-Switch Link (ISL) están deshabilitados en los puertos swp15 y swp16.

  • El archivo de configuración de referencia (RCF) deseado y el conmutador de imagen del sistema operativo Cumulus se cargan en el conmutador.

  • La personalización inicial del switch está completa.

Asegúrese también de que cualquier personalización previa del sitio, como STP, SNMP y SSH, se copie al nuevo conmutador.

Nota Debe ejecutar el comando para migrar un LIF de clúster desde el nodo donde se aloja el LIF de clúster.

Habilitar el registro en la consola

NetApp recomienda encarecidamente que habilite el registro de consola en los dispositivos que esté utilizando y que realice las siguientes acciones al reemplazar su switch:

Reemplace el interruptor

Acerca de los ejemplos

Los ejemplos de este procedimiento utilizan la siguiente nomenclatura de interruptores y nodos:

  • Los nombres de los switches NVIDIA SN2100 existentes son sw1 y sw2.

  • El nombre del nuevo switch NVIDIA SN2100 es nsw2.

  • Los nombres de los nodos son node1 y node2.

  • Los puertos del clúster en cada nodo se llaman e3a y e3b.

  • Los nombres LIF del clúster son node1_clus1 y node1_clus2 para el nodo 1, y node2_clus1 y node2_clus2 para el nodo 2.

  • La solicitud para realizar cambios en todos los nodos del clúster es cluster1::*>

  • Los puertos de ruptura adoptan el formato: swp[puerto]s[puerto de ruptura 0-3]. Por ejemplo, cuatro puertos de ruptura en swp1 son swp1s0, swp1s1, swp1s2 y swp1s3.

Acerca de la topología de la red del clúster

Este procedimiento se basa en la siguiente topología de red de clústeres:

Mostrar topología de ejemplo
cluster1::*> network port show -ipspace Cluster

Node: node1
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false

Node: node2
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false


cluster1::*> network interface show -vserver Cluster

            Logical    Status     Network            Current       Current Is
Vserver     Interface  Admin/Oper Address/Mask       Node          Port    Home
----------- ---------- ---------- ------------------ ------------- ------- ----
Cluster
            node1_clus1  up/up    169.254.209.69/16  node1         e3a     true
            node1_clus2  up/up    169.254.49.125/16  node1         e3b     true
            node2_clus1  up/up    169.254.47.194/16  node2         e3a     true
            node2_clus2  up/up    169.254.19.183/16  node2         e3b     true


cluster1::*> network device-discovery show -protocol lldp
Node/       Local  Discovered
Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
----------- ------ ------------------------- ------------  ----------------
node1      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp3          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp3          -
node2      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp4          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp4          -

+

cumulus@sw1:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw2                e3a
swp4       100G   Trunk/L2    sw2                e3a
swp15      100G   BondMember  sw2                swp15
swp16      100G   BondMember  sw2                swp16


cumulus@sw2:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw1                e3b
swp4       100G   Trunk/L2    sw1                e3b
swp15      100G   BondMember  sw1                swp15
swp16      100G   BondMember  sw1                swp16

Paso 1: Prepararse para el reemplazo

  1. Si AutoSupport está habilitado en este clúster, suprima la creación automática de casos invocando un mensaje de AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=xh

    donde x es la duración de la ventana de mantenimiento en horas.

  2. Cambie el nivel de privilegio a avanzado, ingresando y cuando se le solicite continuar:

    set -privilege advanced

    Aparece el indicador avanzado (*>).

  3. Instale el RCF y la imagen apropiados en el switch, nsw2, y realice las preparaciones necesarias en el sitio.

    Si es necesario, verifique, descargue e instale las versiones adecuadas del software RCF y Cumulus para el nuevo conmutador.

    1. Puede descargar el software Cumulus correspondiente a sus conmutadores de clúster desde el sitio de soporte de NVIDIA. Siga los pasos de la página de descarga para descargar Cumulus Linux para la versión del software ONTAP que está instalando.

    2. El formulario RCF apropiado está disponible en el"Conmutadores de almacenamiento y clúster de NVIDIA" página. Siga los pasos de la página de descarga para descargar el RCF correcto para la versión del software ONTAP que está instalando.

Paso 2: Configurar puertos y cableado

Cumulus Linux 4.4.3
  1. En el nuevo switch nsw2, inicie sesión como administrador y apague todos los puertos que estarán conectados a las interfaces del clúster de nodos (puertos swp1 a swp14).

    Las LIF de los nodos del clúster ya deberían haber conmutado por error al otro puerto del clúster para cada nodo.

    cumulus@nsw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  2. Deshabilitar la reversión automática en los LIF del clúster:

    network interface modify -vserver Cluster -lif * -auto-revert false

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false
    
    Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y
  3. Verifique que todas las LIF del clúster tengan la reversión automática desactivada:

    net interface show -vserver Cluster -fields auto-revert

  4. Desactive los puertos ISL swp15 y swp16 en el switch SN2100 sw1.

    cumulus@sw1:~$ net add interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit
  5. Retire todos los cables del switch SN2100 sw1 y luego conéctelos a los mismos puertos del switch SN2100 nsw2.

  6. Habilite los puertos ISL swp15 y swp16 entre los switches sw1 y nsw2.

    Los siguientes comandos habilitan los puertos ISL swp15 y swp16 en el switch sw1:

    cumulus@sw1:~$ net del interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit

    El siguiente ejemplo muestra que los puertos ISL están activos en el switch sw1:

    cumulus@sw1:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------- ----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  nsw2 (swp15)   Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  nsw2 (swp16)   Master: cluster_isl(UP)

    El siguiente ejemplo muestra que los puertos ISL están activos en el switch nsw2:

    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------  -----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  sw1 (swp15)    Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)    Master: cluster_isl(UP)
  7. Verifique ese puerto e3b está activo en todos los nodos:

    network port show -ipspace Cluster

    El resultado debería ser similar al siguiente:

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                             Ignore
                                                       Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ----- ------------ -------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
    
    
    Node: node2
                                                                             Ignore
                                                       Speed(Mbps) Health    Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper  Status    Status
    --------- ------------ ---------------- ---- ----- ----------- --------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
  8. Los puertos del clúster en cada nodo ahora están conectados a los conmutadores del clúster de la siguiente manera, desde la perspectiva de los nodos:

    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
    ----------- ------ ------------------------- ------------  ----------------
    node1      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp3          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp3          -
    node2      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp4          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp4          -
  9. Verifique que todos los puertos del clúster de nodos estén activos:

    net show interface

    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP              Summary
    -----  -----------  ----  -----  ----------  ----------------- ----------------------
    ...
    ...
    UP     swp3         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp4         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp15        100G  9216   BondMember  sw1 (swp15)       Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)       Master: cluster_isl(UP)
  10. Verifique que ambos nodos tengan una conexión a cada conmutador:

    net show lldp

    El siguiente ejemplo muestra los resultados correspondientes para ambos interruptores:

    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3a
    swp4       100G   Trunk/L2    node2              e3a
    swp15      100G   BondMember  nsw2               swp15
    swp16      100G   BondMember  nsw2               swp16
    
    
    cumulus@nsw2:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1                e3b
    swp4       100G   Trunk/L2    node2                e3b
    swp15      100G   BondMember  sw1                swp15
    swp16      100G   BondMember  sw1                swp16
  11. Habilitar la reversión automática en los LIF del clúster:

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true

  12. En el switch nsw2, active los puertos conectados a los puertos de red de los nodos.

    cumulus@nsw2:~$ net del interface swp1-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  13. Mostrar información sobre los nodos de un clúster:

    cluster show

    Este ejemplo muestra que el estado de salud de los nodos node1 y node2 en este clúster es verdadero:

    cluster1::*> cluster show
    
    Node          Health  Eligibility
    ------------- ------- ------------
    node1         true    true
    node2         true    true
  14. Verifique que todos los puertos físicos del clúster estén activos:

    network port show ipspace Cluster

    cluster1::*> network port show -ipspace Cluster
    
    Node node1                                                               Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace     Broadcast Domain  Link  MTU   Admin/Oper  Status   Status
    --------- ----------- ----------------- ----- ----- ----------- -------- ------
    e3a       Cluster     Cluster           up    9000  auto/10000  healthy  false
    e3b       Cluster     Cluster           up    9000  auto/10000  healthy  false
    
    Node: node2
                                                                             Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link  MTU   Admin/Oper  Status   Status
    --------- ------------ ---------------- ----- ----- ----------- -------- ------
    e3a       Cluster      Cluster          up    9000  auto/10000  healthy  false
    e3b       Cluster      Cluster          up    9000  auto/10000  healthy  false
Cumulus Linux 5.x
  1. En el nuevo switch nsw2, inicie sesión como administrador y apague todos los puertos que estarán conectados a las interfaces del clúster de nodos (puertos swp1 a swp14).

    Las LIF de los nodos del clúster ya deberían haber conmutado por error al otro puerto del clúster para cada nodo.

    cumulus@nsw2:~$ nv set interface swp15-16 link state down
    cumulus@nsw2:~$ nv config apply
  2. Deshabilitar la reversión automática en los LIF del clúster:

    network interface modify -vserver Cluster -lif * -auto-revert false

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false
    
    Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y
  3. Verifique que todas las LIF del clúster tengan la reversión automática desactivada:

    network interface show -vserver Cluster -fields auto-revert

  4. Desactive los puertos ISL swp15 y swp16 en el switch SN2100 sw1.

    cumulus@sw1:~$ nv set interface swp15-16 link state down
    cumulus@sw1:~$ nv config apply
  5. Retire todos los cables del switch SN2100 sw1 y luego conéctelos a los mismos puertos del switch SN2100 nsw2.

  6. Habilite los puertos ISL swp15 y swp16 entre los switches sw1 y nsw2.

    Los siguientes comandos habilitan los puertos ISL swp15 y swp16 en el switch sw1:

    cumulus@sw1:~$ nv set interface swp15-16 link state down
    cumulus@sw1:~$ nv config apply

    El siguiente ejemplo muestra que los puertos ISL están activos en el switch sw1:

    cumulus@sw1:~$ nv show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------- ----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  nsw2 (swp15)   Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  nsw2 (swp16)   Master: cluster_isl(UP)

    El siguiente ejemplo muestra que los puertos ISL están activos en el switch nsw2:

    cumulus@nsw2:~$ nv show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------  -----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  sw1 (swp15)    Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)    Master: cluster_isl(UP)
  7. Verifique ese puerto e3b está activo en todos los nodos:

    network port show -ipspace Cluster

    El resultado debería ser similar al siguiente:

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                             Ignore
                                                       Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ----- ------------ -------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
    
    
    Node: node2
                                                                             Ignore
                                                       Speed(Mbps) Health    Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper  Status    Status
    --------- ------------ ---------------- ---- ----- ----------- --------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
  8. Los puertos del clúster en cada nodo ahora están conectados a los conmutadores del clúster de la siguiente manera, desde la perspectiva de los nodos:

    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
    ----------- ------ ------------------------- ------------  ----------------
    node1      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp3          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp3          -
    node2      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp4          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp4          -
  9. Verifique que todos los puertos del clúster de nodos estén activos:

    nv show interface

    cumulus@nsw2:~$ nv show interface
    
    State  Name         Spd   MTU    Mode        LLDP              Summary
    -----  -----------  ----  -----  ----------  ----------------- ----------------------
    ...
    ...
    UP     swp3         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp4         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp15        100G  9216   BondMember  sw1 (swp15)       Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)       Master: cluster_isl(UP)
  10. Verifique que ambos nodos tengan una conexión a cada conmutador:

    nv show interface lldp

    El siguiente ejemplo muestra los resultados correspondientes para ambos interruptores:

    cumulus@sw1:~$ nv show interface lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3a
    swp4       100G   Trunk/L2    node2              e3a
    swp15      100G   BondMember  nsw2               swp15
    swp16      100G   BondMember  nsw2               swp16
    
    
    cumulus@nsw2:~$ nv show interface lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1                e3b
    swp4       100G   Trunk/L2    node2                e3b
    swp15      100G   BondMember  sw1                swp15
    swp16      100G   BondMember  sw1                swp16
  11. Habilitar la reversión automática en los LIF del clúster:

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true

  12. En el switch nsw2, active los puertos conectados a los puertos de red de los nodos.

    cumulus@nsw2:~$ nv set interface swp1-14 link state up
    cumulus@nsw2:~$ nv config apply
  13. Mostrar información sobre los nodos de un clúster:

    cluster show

    Este ejemplo muestra que el estado de salud de los nodos node1 y node2 en este clúster es verdadero:

    cluster1::*> cluster show
    
    Node          Health  Eligibility
    ------------- ------- ------------
    node1         true    true
    node2         true    true
  14. Verifique que todos los puertos físicos del clúster estén activos:

    network port show ipspace Cluster

    cluster1::*> network port show -ipspace Cluster
    
    Node node1                                                               Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace     Broadcast Domain  Link  MTU   Admin/Oper  Status   Status
    --------- ----------- ----------------- ----- ----- ----------- -------- ------
    e3a       Cluster     Cluster           up    9000  auto/10000  healthy  false
    e3b       Cluster     Cluster           up    9000  auto/10000  healthy  false
    
    Node: node2
                                                                             Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link  MTU   Admin/Oper  Status   Status
    --------- ------------ ---------------- ----- ----- ----------- -------- ------
    e3a       Cluster      Cluster          up    9000  auto/10000  healthy  false
    e3b       Cluster      Cluster          up    9000  auto/10000  healthy  false

Paso 3: Verificar la configuración

Cumulus Linux 4.4.3
  1. Verifique que la red del clúster esté en buen estado.

    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost      RemotePort
    ---------  -----  ----------  --------------  -----------
    swp3       100G   Trunk/L2    node1           e3a
    swp4       100G   Trunk/L2    node2           e3a
    swp15      100G   BondMember  nsw2            swp15
    swp16      100G   BondMember  nsw2            swp16
Cumulus Linux 5.x
  1. Verifique que la red del clúster esté en buen estado.

    cumulus@sw1:~$ nv show interface lldp
    
    LocalPort  Speed  Mode        RemoteHost      RemotePort
    ---------  -----  ----------  --------------  -----------
    swp3       100G   Trunk/L2    node1           e3a
    swp4       100G   Trunk/L2    node2           e3a
    swp15      100G   BondMember  nsw2            swp15
    swp16      100G   BondMember  nsw2            swp16
  1. [[paso 2]] Vuelva a cambiar el nivel de privilegios a administrador:

    set -privilege admin

  2. Si desactivaste la creación automática de casos, vuelve a activarla mediante un mensaje de AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=END

¿Que sigue?

Después de haber reemplazado los interruptores, puedes "configurar la monitorización del estado del conmutador".