Sustituya el conmutador de almacenamiento NVIDIA SN2100
Puede sustituir un conmutador de almacenamiento NVIDIA SN2100 defectuoso. Se trata de un procedimiento no disruptivo.
Antes de instalar el software Cumulus y los RCF en un conmutador de almacenamiento NVIDIA SN2100, asegúrese de que:
-
Su sistema puede admitir los switches de almacenamiento NVIDIA SN2100.
-
Ha descargado los RCF correspondientes.
La "Hardware Universe" proporciona información completa sobre los puertos admitidos y sus configuraciones.
La configuración de red existente debe tener las siguientes características:
-
Asegúrese de que se han completado todos los pasos de solución de problemas para confirmar que es necesario sustituir el interruptor.
-
Debe haber conectividad de gestión en ambos switches.
Asegúrese de que se han completado todos los pasos de solución de problemas para confirmar que es necesario sustituir el interruptor.
El conmutador NVIDIA SN2100 de repuesto debe tener las siguientes características:
-
La conectividad de la red de gestión es funcional.
-
El acceso de la consola al interruptor de sustitución está en su lugar.
-
La imagen apropiada del sistema operativo RCF y Cumulus se carga en el conmutador.
-
Se ha completado la personalización inicial del conmutador.
Este procedimiento sustituye al segundo conmutador de almacenamiento NVIDIA SN2100 sw2 con el nuevo conmutador NVIDIA SN2100 nsw2. Los dos nodos son 1 y 2.
Pasos a completar:
-
Confirmar que el interruptor que se va a sustituir es sw2.
-
Desconecte los cables del interruptor sw2.
-
Vuelva a conectar los cables al conmutador nsw2.
-
Verifique todas las configuraciones del dispositivo en el interruptor nsw2.
-
Si se habilita AutoSupport en este clúster, elimine la creación automática de casos invocando un mensaje de AutoSupport:
system node autosupport invoke -node * -type all - message MAINT=xh
x es la duración de la ventana de mantenimiento en horas.
-
Cambie el nivel de privilegio a avanzado, introduciendo y cuando se le solicite continuar:
set -privilege advanced
-
Compruebe el estado de los puertos del nodo de almacenamiento para asegurarse de que exista conexión al switch de almacenamiento S1:
storage port show -port-type ENET
Muestra el ejemplo
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID -------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
-
Compruebe que el interruptor sw1 de almacenamiento esté disponible:
network device-discovery show -protocol lldp
Muestra el ejemplo
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
-
Ejecute el
net show interface
comando en el switch de trabajo para confirmar que puede ver tanto los nodos como todas las bandejas:net show interface
Muestra el ejemplo
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ------ ---- ----- ---------- -------------------- -------------------- ... ... UP swp1 100G 9216 Trunk/L2 node1 (e3a) Master: bridge(UP) UP swp2 100G 9216 Trunk/L2 node2 (e3a) Master: bridge(UP) UP swp3 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp5 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP) UP swp6 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP)) ... ...
-
Compruebe los puertos de la bandeja en el sistema de almacenamiento:
storage shelf port show -fields remote-device, remote-port
Muestra el ejemplo
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 - - 3.20 2 swp4 sw1 3.20 3 - - 3.30 0 swp5 sw1 3.20 1 - - 3.30 2 swp6 sw1 3.20 3 - - cluster1::*>
-
Retire todos los cables conectados al interruptor de almacenamiento sw2.
-
Vuelva a conectar todos los cables al interruptor de recambio nsw2.
-
Vuelva a comprobar el estado de los puertos del nodo de almacenamiento:
storage port show -port-type ENET
Muestra el ejemplo
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID ---------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
-
Compruebe que ambos conmutadores estén disponibles:
net device-discovery show -protocol lldp
Muestra el ejemplo
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
-
Compruebe los puertos de la bandeja en el sistema de almacenamiento:
storage shelf port show -fields remote-device, remote-port
Muestra el ejemplo
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 swp3 nsw2 3.20 2 swp4 sw1 3.20 3 swp4 nsw2 3.30 0 swp5 sw1 3.20 1 swp5 nsw2 3.30 2 swp6 sw1 3.20 3 swp6 nsw2 cluster1::*>
-
Habilite la función de recogida de registros de control de estado del switch Ethernet para recopilar archivos de registro relacionados con el switch mediante los dos comandos:
system switch ethernet log setup-password
y..system switch ethernet log enable-collection
Introduzca:
system switch ethernet log setup-password
Muestra el ejemplo
cluster1::*> system switch ethernet log setup-password Enter the switch name: <return> The switch name entered is not recognized. Choose from the following list: sw1 nsw2 cluster1::*> system switch ethernet log setup-password Enter the switch name: sw1 RSA key fingerprint is e5:8b:c6:dc:e2:18:18:09:36:63:d9:63:dd:03:d9:cc Do you want to continue? {y|n}::[n] y Enter the password: <enter switch password> Enter the password again: <enter switch password> cluster1::*> system switch ethernet log setup-password Enter the switch name: nsw2 RSA key fingerprint is 57:49:86:a1:b9:80:6a:61:9a:86:8e:3c:e3:b7:1f:b1 Do you want to continue? {y|n}:: [n] y Enter the password: <enter switch password> Enter the password again: <enter switch password>
Seguido de:
system switch ethernet log enable-collection
Muestra el ejemplo
cluster1::*> system switch ethernet log enable-collection Do you want to enable cluster log collection for all nodes in the cluster? {y|n}: [n] y Enabling cluster switch log collection. cluster1::*>
Si alguno de estos comandos devuelve un error, póngase en contacto con el soporte de NetApp. -
Pruebe la función de recopilación de registros de conmutación:
system switch ethernet log collect -device *
Espere 10 minutos y compruebe que la recopilación del registro se ha realizado correctamente mediante el comando:
system switch ethernet log show
Muestra el ejemplo
cluster1::*> system switch ethernet log show Log Collection Enabled: true Index Switch Log Timestamp Status ------ ---------------------------- ------------------- --------- 1 sw1 (b8:ce:f6:19:1b:42) 4/29/2022 03:05:25 complete 2 nsw2 (b8:ce:f6:19:1b:96) 4/29/2022 03:07:42 complete
-
Vuelva a cambiar el nivel de privilegio a admin:
set -privilege admin
-
Si ha suprimido la creación automática de casos, vuelva a habilitarla invocando un mensaje de AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=END