Reemplazar un conmutador de clúster NVIDIA SN2100
Siga este procedimiento para reemplazar un conmutador NVIDIA SN2100 defectuoso en una red de clúster. Este es un procedimiento no disruptivo (NDU).
Requisitos de revisión
Asegúrese de que:
-
Se verifica que los clústeres existentes son completamente funcionales, con al menos un conmutador de clúster totalmente conectado.
-
Todos los puertos del clúster están activos.
-
Todas las interfaces lógicas del clúster (LIF) están activas y en sus puertos de inicio.
-
El ONTAP
cluster ping-cluster -node node1El comando indica que la conectividad básica y la comunicación superior a PMTU se realizan correctamente en todas las rutas.
Asegúrese de que:
-
La conectividad de la red de gestión en el switch de reemplazo funciona correctamente.
-
El acceso a la consola para el interruptor de repuesto ya está habilitado.
-
Las conexiones de nodo son los puertos swp1 a swp14.
-
Todos los puertos Inter-Switch Link (ISL) están deshabilitados en los puertos swp15 y swp16.
-
El archivo de configuración de referencia (RCF) deseado y el conmutador de imagen del sistema operativo Cumulus se cargan en el conmutador.
-
La personalización inicial del switch está completa.
Asegúrese también de que cualquier personalización previa del sitio, como STP, SNMP y SSH, se copie al nuevo conmutador.
|
|
Debe ejecutar el comando para migrar un LIF de clúster desde el nodo donde se aloja el LIF de clúster. |
Habilitar el registro en la consola
NetApp recomienda encarecidamente que habilite el registro de consola en los dispositivos que esté utilizando y que realice las siguientes acciones al reemplazar su switch:
-
Deje activado el AutoSupport durante el mantenimiento.
-
Active un AutoSupport de mantenimiento antes y después del mantenimiento para deshabilitar la creación de casos durante la duración del mismo. Consulte este artículo de la base de conocimientos. "SU92: Cómo suprimir la creación automática de casos durante las ventanas de mantenimiento programadas" Para obtener más detalles.
-
Habilite el registro de sesión para cualquier sesión de la CLI. Para obtener instrucciones sobre cómo habilitar el registro de sesiones, consulte la sección "Registro de salida de sesión" en este artículo de la base de conocimientos. "Cómo configurar PuTTY para una conectividad óptima a los sistemas ONTAP" .
Reemplace el interruptor
Los ejemplos de este procedimiento utilizan la siguiente nomenclatura de interruptores y nodos:
-
Los nombres de los switches NVIDIA SN2100 existentes son sw1 y sw2.
-
El nombre del nuevo switch NVIDIA SN2100 es nsw2.
-
Los nombres de los nodos son node1 y node2.
-
Los puertos del clúster en cada nodo se llaman e3a y e3b.
-
Los nombres LIF del clúster son node1_clus1 y node1_clus2 para el nodo 1, y node2_clus1 y node2_clus2 para el nodo 2.
-
La solicitud para realizar cambios en todos los nodos del clúster es
cluster1::*> -
Los puertos de ruptura adoptan el formato: swp[puerto]s[puerto de ruptura 0-3]. Por ejemplo, cuatro puertos de ruptura en swp1 son swp1s0, swp1s1, swp1s2 y swp1s3.
Este procedimiento se basa en la siguiente topología de red de clústeres:
Mostrar topología de ejemplo
cluster1::*> network port show -ipspace Cluster
Node: node1
Ignore
Speed(Mbps) Health Health
Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a Cluster Cluster up 9000 auto/100000 healthy false
e3b Cluster Cluster up 9000 auto/100000 healthy false
Node: node2
Ignore
Speed(Mbps) Health Health
Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a Cluster Cluster up 9000 auto/100000 healthy false
e3b Cluster Cluster up 9000 auto/100000 healthy false
cluster1::*> network interface show -vserver Cluster
Logical Status Network Current Current Is
Vserver Interface Admin/Oper Address/Mask Node Port Home
----------- ---------- ---------- ------------------ ------------- ------- ----
Cluster
node1_clus1 up/up 169.254.209.69/16 node1 e3a true
node1_clus2 up/up 169.254.49.125/16 node1 e3b true
node2_clus1 up/up 169.254.47.194/16 node2 e3a true
node2_clus2 up/up 169.254.19.183/16 node2 e3b true
cluster1::*> network device-discovery show -protocol lldp
Node/ Local Discovered
Protocol Port Device (LLDP: ChassisID) Interface Platform
----------- ------ ------------------------- ------------ ----------------
node1 /lldp
e3a sw1 (b8:ce:f6:19:1a:7e) swp3 -
e3b sw2 (b8:ce:f6:19:1b:96) swp3 -
node2 /lldp
e3a sw1 (b8:ce:f6:19:1a:7e) swp4 -
e3b sw2 (b8:ce:f6:19:1b:96) swp4 -
+
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 sw2 e3a swp4 100G Trunk/L2 sw2 e3a swp15 100G BondMember sw2 swp15 swp16 100G BondMember sw2 swp16 cumulus@sw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 sw1 e3b swp4 100G Trunk/L2 sw1 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
Paso 1: Prepararse para el reemplazo
-
Si AutoSupport está habilitado en este clúster, suprima la creación automática de casos invocando un mensaje de AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=xhdonde x es la duración de la ventana de mantenimiento en horas.
-
Cambie el nivel de privilegio a avanzado, ingresando y cuando se le solicite continuar:
set -privilege advancedAparece el indicador avanzado (*>).
-
Instale el RCF y la imagen apropiados en el switch, nsw2, y realice las preparaciones necesarias en el sitio.
Si es necesario, verifique, descargue e instale las versiones adecuadas del software RCF y Cumulus para el nuevo conmutador.
-
Puede descargar el software Cumulus correspondiente a sus conmutadores de clúster desde el sitio de soporte de NVIDIA. Siga los pasos de la página de descarga para descargar Cumulus Linux para la versión del software ONTAP que está instalando.
-
El formulario RCF apropiado está disponible en el"Conmutadores de almacenamiento y clúster de NVIDIA" página. Siga los pasos de la página de descarga para descargar el RCF correcto para la versión del software ONTAP que está instalando.
-
Paso 2: Configurar puertos y cableado
-
En el nuevo switch nsw2, inicie sesión como administrador y apague todos los puertos que estarán conectados a las interfaces del clúster de nodos (puertos swp1 a swp14).
Las LIF de los nodos del clúster ya deberían haber conmutado por error al otro puerto del clúster para cada nodo.
cumulus@nsw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@nsw2:~$ net pending cumulus@nsw2:~$ net commit
-
Deshabilitar la reversión automática en los LIF del clúster:
network interface modify -vserver Cluster -lif * -auto-revert falsecluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y -
Verifique que todas las LIF del clúster tengan la reversión automática desactivada:
net interface show -vserver Cluster -fields auto-revert -
Desactive los puertos ISL swp15 y swp16 en el switch SN2100 sw1.
cumulus@sw1:~$ net add interface swp15-16 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit
-
Retire todos los cables del switch SN2100 sw1 y luego conéctelos a los mismos puertos del switch SN2100 nsw2.
-
Habilite los puertos ISL swp15 y swp16 entre los switches sw1 y nsw2.
Los siguientes comandos habilitan los puertos ISL swp15 y swp16 en el switch sw1:
cumulus@sw1:~$ net del interface swp15-16 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit
El siguiente ejemplo muestra que los puertos ISL están activos en el switch sw1:
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- -------------- ---------------------- ... ... UP swp15 100G 9216 BondMember nsw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember nsw2 (swp16) Master: cluster_isl(UP)
El siguiente ejemplo muestra que los puertos ISL están activos en el switch nsw2:
cumulus@nsw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ------------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
Verifique ese puerto
e3bestá activo en todos los nodos:network port show -ipspace ClusterEl resultado debería ser similar al siguiente:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ------------ -------- ------- e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- --------- ------- e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
Los puertos del clúster en cada nodo ahora están conectados a los conmutadores del clúster de la siguiente manera, desde la perspectiva de los nodos:
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ------------ ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b nsw2 (b8:ce:f6:19:1b:b6) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b nsw2 (b8:ce:f6:19:1b:b6) swp4 - -
Verifique que todos los puertos del clúster de nodos estén activos:
net show interfacecumulus@nsw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
Verifique que ambos nodos tengan una conexión a cada conmutador:
net show lldpEl siguiente ejemplo muestra los resultados correspondientes para ambos interruptores:
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember nsw2 swp15 swp16 100G BondMember nsw2 swp16 cumulus@nsw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
-
Habilitar la reversión automática en los LIF del clúster:
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true -
En el switch nsw2, active los puertos conectados a los puertos de red de los nodos.
cumulus@nsw2:~$ net del interface swp1-14 link down cumulus@nsw2:~$ net pending cumulus@nsw2:~$ net commit
-
Mostrar información sobre los nodos de un clúster:
cluster showEste ejemplo muestra que el estado de salud de los nodos node1 y node2 en este clúster es verdadero:
cluster1::*> cluster show Node Health Eligibility ------------- ------- ------------ node1 true true node2 true true
-
Verifique que todos los puertos físicos del clúster estén activos:
network port show ipspace Clustercluster1::*> network port show -ipspace Cluster Node node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ----------------- ----- ----- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ----- ----- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false
-
En el nuevo switch nsw2, inicie sesión como administrador y apague todos los puertos que estarán conectados a las interfaces del clúster de nodos (puertos swp1 a swp14).
Las LIF de los nodos del clúster ya deberían haber conmutado por error al otro puerto del clúster para cada nodo.
cumulus@nsw2:~$ nv set interface swp15-16 link state down cumulus@nsw2:~$ nv config apply
-
Deshabilitar la reversión automática en los LIF del clúster:
network interface modify -vserver Cluster -lif * -auto-revert falsecluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y -
Verifique que todas las LIF del clúster tengan la reversión automática desactivada:
network interface show -vserver Cluster -fields auto-revert -
Desactive los puertos ISL swp15 y swp16 en el switch SN2100 sw1.
cumulus@sw1:~$ nv set interface swp15-16 link state down cumulus@sw1:~$ nv config apply
-
Retire todos los cables del switch SN2100 sw1 y luego conéctelos a los mismos puertos del switch SN2100 nsw2.
-
Habilite los puertos ISL swp15 y swp16 entre los switches sw1 y nsw2.
Los siguientes comandos habilitan los puertos ISL swp15 y swp16 en el switch sw1:
cumulus@sw1:~$ nv set interface swp15-16 link state down cumulus@sw1:~$ nv config apply
El siguiente ejemplo muestra que los puertos ISL están activos en el switch sw1:
cumulus@sw1:~$ nv show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- -------------- ---------------------- ... ... UP swp15 100G 9216 BondMember nsw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember nsw2 (swp16) Master: cluster_isl(UP)
El siguiente ejemplo muestra que los puertos ISL están activos en el switch nsw2:
cumulus@nsw2:~$ nv show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ------------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
Verifique ese puerto
e3bestá activo en todos los nodos:network port show -ipspace ClusterEl resultado debería ser similar al siguiente:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ------------ -------- ------- e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- --------- ------- e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
Los puertos del clúster en cada nodo ahora están conectados a los conmutadores del clúster de la siguiente manera, desde la perspectiva de los nodos:
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ------------ ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b nsw2 (b8:ce:f6:19:1b:b6) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b nsw2 (b8:ce:f6:19:1b:b6) swp4 - -
Verifique que todos los puertos del clúster de nodos estén activos:
nv show interfacecumulus@nsw2:~$ nv show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
Verifique que ambos nodos tengan una conexión a cada conmutador:
nv show interface lldpEl siguiente ejemplo muestra los resultados correspondientes para ambos interruptores:
cumulus@sw1:~$ nv show interface lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember nsw2 swp15 swp16 100G BondMember nsw2 swp16 cumulus@nsw2:~$ nv show interface lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
-
Habilitar la reversión automática en los LIF del clúster:
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true -
En el switch nsw2, active los puertos conectados a los puertos de red de los nodos.
cumulus@nsw2:~$ nv set interface swp1-14 link state up cumulus@nsw2:~$ nv config apply
-
Mostrar información sobre los nodos de un clúster:
cluster showEste ejemplo muestra que el estado de salud de los nodos node1 y node2 en este clúster es verdadero:
cluster1::*> cluster show Node Health Eligibility ------------- ------- ------------ node1 true true node2 true true
-
Verifique que todos los puertos físicos del clúster estén activos:
network port show ipspace Clustercluster1::*> network port show -ipspace Cluster Node node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ----------------- ----- ----- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ----- ----- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false
Paso 3: Verificar la configuración
-
Verifique que la red del clúster esté en buen estado.
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- -------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember nsw2 swp15 swp16 100G BondMember nsw2 swp16
-
Verifique que la red del clúster esté en buen estado.
cumulus@sw1:~$ nv show interface lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- -------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember nsw2 swp15 swp16 100G BondMember nsw2 swp16
-
[[paso 2]] Vuelva a cambiar el nivel de privilegios a administrador:
set -privilege admin -
Si desactivaste la creación automática de casos, vuelve a activarla mediante un mensaje de AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=END
Después de haber reemplazado los interruptores, puedes "configurar la monitorización del estado del conmutador".