Migrar de un conmutador de clúster Cisco a un conmutador de clúster NVIDIA SN2100
Puede migrar sin interrupciones los switches de clúster de Cisco para un clúster ONTAP a switches de clúster NVIDIA SN2100. Debe tener en cuenta cierta información de configuración, conexiones de puertos y requisitos de cableado cuando reemplace algunos conmutadores de clúster Cisco antiguos con conmutadores de clúster NVIDIA SN2100.
Se admiten los siguientes conmutadores de clúster de Cisco :
-
Nexus 9336C-FX2
-
Nexus 92300YC
-
Nexus 5596UP
-
Nexus 3232C
-
Nexus 3132Q-V
Puede migrar sin interrupciones los switches de clúster Cisco más antiguos para un clúster ONTAP a switches de clúster NVIDIA SN2100.
-
El clúster existente debe estar configurado y funcionando correctamente.
-
Todos los puertos del clúster deben estar en estado activo para garantizar un funcionamiento sin interrupciones.
-
Los conmutadores de clúster NVIDIA SN2100 deben estar configurados y funcionando bajo la versión correcta de Cumulus Linux instalada con el archivo de configuración de referencia (RCF) aplicado.
-
La configuración de red del clúster existente debe tener lo siguiente:
-
Un clúster NetApp redundante y totalmente funcional que utiliza ambos switches Cisco antiguos.
-
Conectividad de gestión y acceso a la consola tanto para los switches Cisco antiguos como para los nuevos.
-
Todas las LIF del clúster en estado activo están en sus puertos de origen.
-
Puertos ISL habilitados y cableados entre los switches Cisco antiguos y entre los switches nuevos.
-
-
Ver el "Hardware Universe" Para obtener información detallada sobre los puertos compatibles y sus configuraciones.
-
Has configurado algunos de los puertos de los switches NVIDIA SN2100 para que funcionen a 40 GbE o 100 GbE.
-
Usted ha planificado, migrado y documentado la conectividad de 40 GbE y 100 GbE desde los nodos a los conmutadores de clúster NVIDIA SN2100.
En este procedimiento, se utilizan switches de clúster Cisco Nexus 3232C como ejemplos de comandos y salidas.
Los ejemplos de este procedimiento utilizan la siguiente nomenclatura de interruptores y nodos:
-
Los switches de clúster Cisco Nexus 3232C existentes son c1 y c2.
-
Los nuevos conmutadores de clúster NVIDIA SN2100 son sw1 y sw2.
-
Los nodos son nodo1 y nodo2.
-
Los LIF del clúster son node1_clus1 y node1_clus2 en el nodo 1, y node2_clus1 y node2_clus2 en el nodo 2 respectivamente.
-
El
cluster1::*>El indicador muestra el nombre del clúster. -
Los puertos del clúster utilizados en este procedimiento son e3a y e3b.
-
Los puertos de ruptura adoptan el formato: swp[puerto]s[puerto de ruptura 0-3]. Por ejemplo, cuatro puertos de ruptura en swp1 son swp1s0, swp1s1, swp1s2 y swp1s3.
-
El interruptor c2 se reemplaza primero por el interruptor sw2 y luego el interruptor c1 se reemplaza por el interruptor sw1.
-
Luego, el cableado entre los nodos y c2 se desconecta de c2 y se vuelve a conectar a sw2.
-
Luego, el cableado entre los nodos y c1 se desconecta de c1 y se vuelve a conectar a sw1.
-
-
Si AutoSupport está habilitado en este clúster, suprima la creación automática de casos invocando un mensaje de AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=xhdonde x es la duración de la ventana de mantenimiento en horas.
-
Cambie el nivel de privilegio a avanzado, ingresando y cuando se le solicite continuar:
set -privilege advancedAparece el indicador avanzado (*>).
-
Deshabilitar la reversión automática en los LIF del clúster:
network interface modify -vserver Cluster -lif * -auto-revert falsecluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y -
Determinar el estado administrativo u operativo de cada interfaz de clúster:
Cada puerto debería mostrarse para
Linky saludable paraHealth Status.-
Mostrar los atributos del puerto de red:
network port show -ipspace Clustercluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
Muestra información sobre las interfaces lógicas y sus nodos de origen designados:
network interface show -vserver ClusterCada LIF debe mostrar arriba/arriba para
Status Admin/Opery cierto paraIs Home.
cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ----------- ---------- ------------------ ----------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true -
-
Los puertos del clúster en cada nodo se conectan a los conmutadores del clúster existentes de la siguiente manera (desde la perspectiva de los nodos) utilizando el comando:
network device-discovery show -protocol lldpcluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1 /lldp e3a c1 (6a:ad:4f:98:3b:3f) Eth1/1 - e3b c2 (6a:ad:4f:98:4c:a4) Eth1/1 - node2 /lldp e3a c1 (6a:ad:4f:98:3b:3f) Eth1/2 - e3b c2 (6a:ad:4f:98:4c:a4) Eth1/2 - -
Los puertos y conmutadores del clúster están conectados de la siguiente manera (desde la perspectiva de los conmutadores) mediante el siguiente comando:
show cdp neighborsc1# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 124 H AFF-A400 e3a node2 Eth1/2 124 H AFF-A400 e3a c2 Eth1/31 179 S I s N3K-C3232C Eth1/31 c2 Eth1/32 175 S I s N3K-C3232C Eth1/32 c2# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 124 H AFF-A400 e3b node2 Eth1/2 124 H AFF-A400 e3b c1 Eth1/31 175 S I s N3K-C3232C Eth1/31 c1 Eth1/32 175 S I s N3K-C3232C Eth1/32 -
Verifique la conectividad de las interfaces del clúster remoto:
Puedes usar el network interface check cluster-connectivity comando para iniciar una comprobación de accesibilidad para la conectividad del clúster y luego mostrar los detalles:
network interface check cluster-connectivity start`y `network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
NOTA: Espere unos segundos antes de ejecutar el programa. show comando para mostrar los detalles.
cluster1::*> network interface check cluster-connectivity show
Source Destination Packet
Node Date LIF LIF Loss
------ -------------------------- ---------------- ---------------- -----------
node1
3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none
3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none
node2
3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none
3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
Para todas las versiones de ONTAP , también puede usar el cluster ping-cluster -node <name> comando para comprobar la conectividad:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local
Host is node2
Getting addresses from network interface table...
Cluster node1_clus1 169.254.209.69 node1 e3a
Cluster node1_clus2 169.254.49.125 node1 e3b
Cluster node2_clus1 169.254.47.194 node2 e3a
Cluster node2_clus2 169.254.19.183 node2 e3b
Local = 169.254.47.194 169.254.19.183
Remote = 169.254.209.69 169.254.49.125
Cluster Vserver Id = 4294967293
Ping status:....
Basic connectivity succeeds on 4 path(s)
Basic connectivity fails on 0 path(s)
................
Detected 9000 byte MTU on 4 path(s):
Local 169.254.19.183 to Remote 169.254.209.69
Local 169.254.19.183 to Remote 169.254.49.125
Local 169.254.47.194 to Remote 169.254.209.69
Local 169.254.47.194 to Remote 169.254.49.125
Larger than PMTU communication succeeds on 4 path(s)
RPC status:
2 paths up, 0 paths down (tcp check)
2 paths up, 0 paths down (udp check)
-
En el switch c2, apague los puertos conectados a los puertos del clúster de los nodos.
(c2)# configure Enter configuration commands, one per line. End with CNTL/Z. (c2)(Config)# interface (c2)(config-if-range)# shutdown <interface_list> (c2)(config-if-range)# exit (c2)(Config)# exit (c2)#
-
Traslade los puertos del clúster de nodos del antiguo switch c2 al nuevo switch sw2, utilizando el cableado adecuado compatible con NVIDIA SN2100.
-
Mostrar los atributos del puerto de red:
network port show -ipspace Clustercluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
Los puertos del clúster en cada nodo ahora están conectados a los conmutadores del clúster de la siguiente manera, desde la perspectiva de los nodos:
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1 /lldp e3a c1 (6a:ad:4f:98:3b:3f) Eth1/1 - e3b sw2 (b8:ce:f6:19:1a:7e) swp3 - node2 /lldp e3a c1 (6a:ad:4f:98:3b:3f) Eth1/2 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 - -
En el switch sw2, verifique que todos los puertos del clúster de nodos estén activos:
net show interfacecumulus@sw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
En el switch c1, apague los puertos conectados a los puertos del clúster de los nodos.
(c1)# configure Enter configuration commands, one per line. End with CNTL/Z. (c1)(Config)# interface (c1)(config-if-range)# shutdown <interface_list> (c1)(config-if-range)# exit (c1)(Config)# exit (c1)#
-
Traslade los puertos del clúster de nodos del antiguo conmutador c1 al nuevo conmutador sw1, utilizando el cableado adecuado compatible con NVIDIA SN2100.
-
Verifique la configuración final del clúster:
network port show -ipspace ClusterCada puerto debería mostrarse para
Linky saludable paraHealth Status.cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
Los puertos del clúster en cada nodo ahora están conectados a los conmutadores del clúster de la siguiente manera, desde la perspectiva de los nodos:
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- -------------- ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b sw2 (b8:ce:f6:19:1b:96) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 - -
En los conmutadores sw1 y sw2, verifique que todos los puertos del clúster de nodos estén activos:
net show interfacecumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 e3a Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 e3a Master: bridge(UP) UP swp15 100G 9216 BondMember sw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw2 (swp16) Master: cluster_isl(UP) cumulus@sw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ----------------------- ... ... UP swp3 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
Verifique que ambos nodos tengan una conexión a cada conmutador:
net show lldpEl siguiente ejemplo muestra los resultados correspondientes para ambos interruptores:
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ------------------ ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember sw2 swp15 swp16 100G BondMember sw2 swp16 cumulus@sw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ------------------ ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
-
Habilitar la reversión automática en los LIF del clúster:
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true -
Verifique que todas las LIF de la red del clúster hayan vuelto a sus puertos de origen:
network interface showcluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true -
Habilite la función de recopilación de registros del monitor de estado del switch Ethernet para recopilar archivos de registro relacionados con el switch, utilizando los dos comandos:
system switch ethernet log setup-passwordysystem switch ethernet log enable-collectionIngresar:
system switch ethernet log setup-passwordcluster1::*> system switch ethernet log setup-password Enter the switch name: <return> The switch name entered is not recognized. Choose from the following list: sw1 sw2 cluster1::*> system switch ethernet log setup-password Enter the switch name: sw1 RSA key fingerprint is e5:8b:c6:dc:e2:18:18:09:36:63:d9:63:dd:03:d9:cc Do you want to continue? {y|n}::[n] y Enter the password: <enter switch password> Enter the password again: <enter switch password> cluster1::*> system switch ethernet log setup-password Enter the switch name: sw2 RSA key fingerprint is 57:49:86:a1:b9:80:6a:61:9a:86:8e:3c:e3:b7:1f:b1 Do you want to continue? {y|n}:: [n] y Enter the password: <enter switch password> Enter the password again: <enter switch password>Seguido de:
system switch ethernet log enable-collectioncluster1::*> system switch ethernet log enable-collection Do you want to enable cluster log collection for all nodes in the cluster? {y|n}: [n] y Enabling cluster switch log collection. cluster1::*>Si alguno de estos comandos devuelve un error, póngase en contacto con el soporte de NetApp . -
Inicie la función de recopilación de registros del switch:
system switch ethernet log collect -device *Espere 10 minutos y luego verifique que la recopilación de registros se haya realizado correctamente utilizando el comando:
system switch ethernet log showcluster1::*> system switch ethernet log show Log Collection Enabled: true Index Switch Log Timestamp Status ------ ---------------------------- ------------------- --------- 1 sw1 (b8:ce:f6:19:1b:42) 4/29/2022 03:05:25 complete 2 sw2 (b8:ce:f6:19:1b:96) 4/29/2022 03:07:42 complete
-
Vuelva a cambiar el nivel de privilegios a administrador:
set -privilege admin -
Si desactivaste la creación automática de casos, vuelve a activarla mediante un mensaje de AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=END