Sostituire uno switch di storage NVIDIA SN2100
È possibile sostituire uno switch di storage NVIDIA SN2100 difettoso. Si tratta di una procedura senza interruzioni.
Prima di installare il software Cumulus e gli RCF su uno switch di storage NVIDIA SN2100, assicurarsi che:
Il sistema supporta gli switch storage NVIDIA SN2100.
Hai scaricato gli RCF applicabili.
Il "Hardware Universe" fornisce informazioni dettagliate sulle porte supportate e sulle relative configurazioni.
La configurazione di rete esistente deve avere le seguenti caratteristiche:
Assicurarsi che tutte le fasi di risoluzione dei problemi siano state completate per confermare che lo switch deve essere sostituito.
La connettività di gestione deve esistere su entrambi gli switch.
Assicurarsi che tutte le fasi di risoluzione dei problemi siano state completate per confermare che lo switch deve essere sostituito.
Lo switch NVIDIA SN2100 sostitutivo deve avere le seguenti caratteristiche:
La connettività di rete per la gestione è funzionale.
L'accesso della console allo switch sostitutivo è in posizione.
Sullo switch viene caricata l'immagine appropriata del sistema operativo RCF e Cumulus.
La personalizzazione iniziale dello switch è completata.
Questa procedura sostituisce il secondo switch di storage NVIDIA SN2100 sw2 con il nuovo switch NVIDIA SN2100 nsw2. I due nodi sono node1 e node2.
Procedura da completare:
Verificare che lo switch da sostituire sia sw2.
Scollegare i cavi dallo switch sw2.
Ricollegare i cavi allo switch nsw2.
Verificare tutte le configurazioni del dispositivo sullo switch nsw2.
Se AutoSupport è attivato su questo cluster, eliminare la creazione automatica del caso richiamando un messaggio AutoSupport:
system node autosupport invoke -node * -type all - message MAINT=xh
x è la durata della finestra di manutenzione in ore.
Impostare il livello di privilegio su Advanced (avanzato), immettendo y quando viene richiesto di continuare:
set -privilege advanced
Controllare lo stato delle porte dei nodi di storage per verificare che vi sia una connessione allo switch di storage S1:
storage port show -port-type ENET
Mostra esempio
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID -------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
Verificare che lo switch di storage sw1 sia disponibile:
network device-discovery show -protocol lldp
Mostra esempio
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
net show interface
comando sull'interruttore funzionante per confermare che è possibile visualizzare sia i nodi che tutti gli shelf:net show interface
Mostra esempio
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ------ ---- ----- ---------- -------------------- -------------------- ... ... UP swp1 100G 9216 Trunk/L2 node1 (e3a) Master: bridge(UP) UP swp2 100G 9216 Trunk/L2 node2 (e3a) Master: bridge(UP) UP swp3 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp5 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP) UP swp6 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP)) ... ...
Verificare le porte dello shelf nel sistema storage:
storage shelf port show -fields remote-device, remote-port
Mostra esempio
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 - - 3.20 2 swp4 sw1 3.20 3 - - 3.30 0 swp5 sw1 3.20 1 - - 3.30 2 swp6 sw1 3.20 3 - - cluster1::*>
Rimuovere tutti i cavi collegati allo switch di storage sw2.
Ricollegare tutti i cavi allo switch sostitutivo nsw2.
Controllare nuovamente lo stato di salute delle porte del nodo di storage:
storage port show -port-type ENET
Mostra esempio
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID ---------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
Verificare che entrambi gli switch siano disponibili:
net device-discovery show -protocol lldp
Mostra esempio
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
Verificare le porte dello shelf nel sistema storage:
storage shelf port show -fields remote-device, remote-port
Mostra esempio
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 swp3 nsw2 3.20 2 swp4 sw1 3.20 3 swp4 nsw2 3.30 0 swp5 sw1 3.20 1 swp5 nsw2 3.30 2 swp6 sw1 3.20 3 swp6 nsw2 cluster1::*>
Modificare nuovamente il livello di privilegio in admin:
set -privilege admin
Se è stata eliminata la creazione automatica del caso, riattivarla richiamando un messaggio AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=END