Skip to main content
Cluster and storage switches
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Remplacement d'un commutateur de stockage NVIDIA SN2100

Contributeurs

Vous pouvez remplacer un commutateur de stockage NVIDIA SN2100 défectueux. Cette procédure ne fonctionne pas sans interruption.

Ce dont vous avez besoin

Avant d'installer le logiciel Cumulus et les RCFs sur un commutateur de stockage NVIDIA SN2100, vérifiez que :

  • Votre système peut prendre en charge les switchs de stockage NVIDIA SN2100.

  • Vous avez téléchargé les CFR applicables.

Le "Hardware Universe" fournit des détails complets sur les ports pris en charge et leurs configurations.

La configuration réseau existante doit présenter les caractéristiques suivantes :

  • Assurez-vous que toutes les étapes de dépannage ont été effectuées pour vérifier que votre commutateur doit être remplacé.

  • La connectivité de gestion doit exister sur les deux commutateurs.

    Remarque Assurez-vous que toutes les étapes de dépannage ont été effectuées pour vérifier que votre commutateur doit être remplacé.

Les caractéristiques du commutateur NVIDIA SN2100 de remplacement doivent être les suivantes :

  • La connectivité du réseau de gestion est fonctionnelle.

  • L'accès à la console au commutateur de remplacement est en place.

  • L'image appropriée du système d'exploitation FCR et Cumulus est chargée sur le commutateur.

  • La personnalisation initiale du commutateur est terminée.

Récapitulatif de la procédure

Cette procédure remplace le deuxième commutateur de stockage NVIDIA SN2100 sw2 par le nouveau commutateur NVIDIA SN2100 nsw2. Les deux nœuds sont le nœud1 et le nœud2.

Étapes à suivre :

  • Vérifier que le commutateur à remplacer est sw2.

  • Débrancher les câbles du commutateur sw2.

  • Rebrancher les câbles sur le commutateur nsw2.

  • Vérifiez toutes les configurations de périphérique sur le commutateur nsw2.

Étapes
  1. Si AutoSupport est activé sur ce cluster, supprimez la création automatique de dossiers en invoquant un message AutoSupport :

    system node autosupport invoke -node * -type all - message MAINT=xh

    x représente la durée de la fenêtre de maintenance en heures.

  2. Définissez le niveau de privilège sur avancé, en entrant y lorsque vous êtes invité à continuer :

    set -privilege advanced

  3. Vérifier l'état de santé des ports du nœud de stockage pour s'assurer qu'il existe une connexion au commutateur de stockage S1 :

    storage port show -port-type ENET

    Montrer l'exemple
    cluster1::*> storage port show -port-type ENET
                                      Speed                     VLAN
    Node           Port Type  Mode    (Gb/s) State    Status      ID
    -------------- ---- ----- ------- ------ -------- --------- ----
    node1
                   e3a  ENET  storage 100    enabled  online      30
                   e3b  ENET  storage   0    enabled  offline     30
                   e7a  ENET  storage   0    enabled  offline     30
                   e7b  ENET  storage 100    enabled  online      30
    node2
                   e3a  ENET  storage 100    enabled  online      30
                   e3b  ENET  storage   0    enabled  offline     30
                   e7a  ENET  storage   0    enabled  offline     30
                   e7b  ENET  storage 100    enabled  online      30
    cluster1::*>
  4. Vérifier que le commutateur de stockage sw1 est disponible :

    network device-discovery show -protocol lldp

    Montrer l'exemple
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface         Platform
    ----------- ------ ------------------------- ----------------  ----------------
    node1/lldp
                e0M    sw1 (00:ea:bd:68:6a:e8)   Eth1/46           -
                e0b    sw2 (6c:b2:ae:5f:a5:b2)   Ethernet1/16      -
                e0c    SHFFG1827000286 (d0:39:ea:1c:16:92)
                                                 e0a               -
                e0e    sw3 (6c:b2:ae:5f:a5:ba)   Ethernet1/18      -
                e0f    SHFFG1827000286 (00:a0:98:fd:e4:a9)
                                                 e0b               -
                e0g    sw4 (28:ac:9e:d5:4a:9c)   Ethernet1/11      -
                e0h    sw5 (6c:b2:ae:5f:a5:ca)   Ethernet1/22      -
                e1a    sw6 (00:f6:63:10:be:7c)   Ethernet1/33      -
                e1b    sw7 (00:f6:63:10:be:7d)   Ethernet1/34      -
                e2a    sw8 (b8:ce:f6:91:3d:88)   Ethernet1/35      -
    Press <space> to page down, <return> for next line, or 'q' to quit...
    10 entries were displayed.
  5. Exécutez le net show interface commande sur le commutateur de travail pour confirmer que vous pouvez voir les deux nœuds et tous les tiroirs :

    net show interface

    Montrer l'exemple
    cumulus@sw1:~$ net show interface
    
    State  Name    Spd   MTU    Mode        LLDP                  Summary
    -----  ------  ----  -----  ----------  --------------------  --------------------
    ...
    ...
    UP     swp1    100G  9216   Trunk/L2   node1 (e3a)             Master: bridge(UP)
    UP     swp2    100G  9216   Trunk/L2   node2 (e3a)             Master: bridge(UP)
    UP     swp3    100G  9216   Trunk/L2   SHFFG1826000112 (e0b)   Master: bridge(UP)
    UP     swp4    100G  9216   Trunk/L2   SHFFG1826000112 (e0b)   Master: bridge(UP)
    UP     swp5    100G  9216   Trunk/L2   SHFFG1826000102 (e0b)   Master: bridge(UP)
    UP     swp6    100G  9216   Trunk/L2   SHFFG1826000102 (e0b)   Master: bridge(UP))
    ...
    ...
  6. Vérifiez les ports shelf dans le système de stockage :

    storage shelf port show -fields remote-device, remote-port

    Montrer l'exemple
    cluster1::*> storage shelf port show -fields remote-device, remote-port
    shelf   id  remote-port   remote-device
    -----   --  -----------   -------------
    3.20    0   swp3          sw1
    3.20    1   -             -
    3.20    2   swp4          sw1
    3.20    3   -             -
    3.30    0   swp5          sw1
    3.20    1   -             -
    3.30    2   swp6          sw1
    3.20    3   -             -
    cluster1::*>
  7. Retirer tous les câbles reliés au commutateur de stockage sw2.

  8. Rebranchez tous les câbles au commutateur de remplacement nsw2.

  9. Vérifier à nouveau l'état de santé des ports du nœud de stockage :

    storage port show -port-type ENET

    Montrer l'exemple
    cluster1::*> storage port show -port-type ENET
                                        Speed                     VLAN
    Node             Port Type  Mode    (Gb/s) State    Status      ID
    ---------------- ---- ----- ------- ------ -------- --------- ----
    node1
                     e3a  ENET  storage 100    enabled  online      30
                     e3b  ENET  storage   0    enabled  offline     30
                     e7a  ENET  storage   0    enabled  offline     30
                     e7b  ENET  storage 100    enabled  online      30
    node2
                     e3a  ENET  storage 100    enabled  online      30
                     e3b  ENET  storage   0    enabled  offline     30
                     e7a  ENET  storage   0    enabled  offline     30
                     e7b  ENET  storage 100    enabled  online      30
    cluster1::*>
  10. Vérifier que les deux commutateurs sont disponibles :

    net device-discovery show -protocol lldp

    Montrer l'exemple
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface         Platform
    ----------- ------ ------------------------- ----------------  ----------------
    node1/lldp
                e0M    sw1 (00:ea:bd:68:6a:e8)   Eth1/46           -
                e0b    sw2 (6c:b2:ae:5f:a5:b2)   Ethernet1/16      -
                e0c    SHFFG1827000286 (d0:39:ea:1c:16:92)
                                                 e0a               -
                e0e    sw3 (6c:b2:ae:5f:a5:ba)   Ethernet1/18      -
                e0f    SHFFG1827000286 (00:a0:98:fd:e4:a9)
                                                 e0b               -
                e0g    sw4 (28:ac:9e:d5:4a:9c)   Ethernet1/11      -
                e0h    sw5 (6c:b2:ae:5f:a5:ca)   Ethernet1/22      -
                e1a    sw6 (00:f6:63:10:be:7c)   Ethernet1/33      -
                e1b    sw7 (00:f6:63:10:be:7d)   Ethernet1/34      -
                e2a    sw8 (b8:ce:f6:91:3d:88)   Ethernet1/35      -
    Press <space> to page down, <return> for next line, or 'q' to quit...
    10 entries were displayed.
  11. Vérifiez les ports shelf dans le système de stockage :

    storage shelf port show -fields remote-device, remote-port

    Montrer l'exemple
    cluster1::*> storage shelf port show -fields remote-device, remote-port
    shelf   id    remote-port     remote-device
    -----   --    -----------     -------------
    3.20    0     swp3            sw1
    3.20    1     swp3            nsw2
    3.20    2     swp4            sw1
    3.20    3     swp4            nsw2
    3.30    0     swp5            sw1
    3.20    1     swp5            nsw2
    3.30    2     swp6            sw1
    3.20    3     swp6            nsw2
    cluster1::*>
  12. Rétablissez le niveau de privilège sur admin :

    set -privilege admin

  13. Si vous avez supprimé la création automatique de cas, réactivez-la en appelant un message AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=END