Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

NVIDIA SN2100ストレージスイッチを交換してください

共同作成者

障害のあるNVIDIA SN2100ストレージスイッチを交換できます。これは無停止の手順です。

必要なもの

NVIDIA SN2100ストレージスイッチにCumulusソフトウェアとRCFをインストールする前に、次の点を確認してください。

  • お使いのシステムではNVIDIA SN2100ストレージスイッチをサポートできます。

  • 該当するRCFをダウンロードしておきます。

"Hardware Universe" サポートされているポートとその構成の詳細が表示されます。

既存のネットワーク構成には、次のような特徴があります。

  • スイッチの交換が必要かどうかを確認するために、すべてのトラブルシューティング手順が完了していることを確認します。

  • 両方のスイッチで管理接続が確立されている必要があります。

    メモ スイッチの交換が必要かどうかを確認するために、すべてのトラブルシューティング手順が完了していることを確認します。

交換用NVIDIA SN2100スイッチには次の特性が必要です。

  • 管理ネットワーク接続は機能しています。

  • 交換用スイッチへのコンソールアクセスが確立されています。

  • 適切なRCFおよびCumulusオペレーティングシステムイメージがスイッチにロードされます。

  • スイッチの初期カスタマイズが完了しました。

手順のまとめ

この手順 は、2台目のNVIDIA SN2100ストレージスイッチSW2を新しいNVIDIA SN2100スイッチnsw2に置き換えます。2 つのノードは node1 と node2 になります。

完了する手順:

  • 交換するスイッチがSW2であることを確認します。

  • スイッチSW2からケーブルを外します。

  • スイッチnsw2にケーブルを再接続します。

  • スイッチnsw2のすべてのデバイス設定を確認します。

手順
  1. このクラスタで AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。

    'system node AutoSupport invoke -node * -type all -message MAINT=xh`

    x は、メンテナンス時間の長さ(時間単位)です。

  2. 権限レベルを advanced に変更します。続行するかどうかを尋ねられたら、「 * y * 」と入力します。

    「 advanced 」の権限が必要です

  3. ストレージノードポートのヘルスステータスをチェックして、ストレージスイッチ S1 に接続されていることを確認します。

    storage port show -port-type enet

    例を示します
    cluster1::*> storage port show -port-type ENET
                                      Speed                     VLAN
    Node           Port Type  Mode    (Gb/s) State    Status      ID
    -------------- ---- ----- ------- ------ -------- --------- ----
    node1
                   e3a  ENET  storage 100    enabled  online      30
                   e3b  ENET  storage   0    enabled  offline     30
                   e7a  ENET  storage   0    enabled  offline     30
                   e7b  ENET  storage 100    enabled  online      30
    node2
                   e3a  ENET  storage 100    enabled  online      30
                   e3b  ENET  storage   0    enabled  offline     30
                   e7a  ENET  storage   0    enabled  offline     30
                   e7b  ENET  storage 100    enabled  online      30
    cluster1::*>
  4. ストレージスイッチsw1が使用可能であることを確認します。

    network device-discovery show -protocol lldp

    例を示します
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface         Platform
    ----------- ------ ------------------------- ----------------  ----------------
    node1/lldp
                e0M    sw1 (00:ea:bd:68:6a:e8)   Eth1/46           -
                e0b    sw2 (6c:b2:ae:5f:a5:b2)   Ethernet1/16      -
                e0c    SHFFG1827000286 (d0:39:ea:1c:16:92)
                                                 e0a               -
                e0e    sw3 (6c:b2:ae:5f:a5:ba)   Ethernet1/18      -
                e0f    SHFFG1827000286 (00:a0:98:fd:e4:a9)
                                                 e0b               -
                e0g    sw4 (28:ac:9e:d5:4a:9c)   Ethernet1/11      -
                e0h    sw5 (6c:b2:ae:5f:a5:ca)   Ethernet1/22      -
                e1a    sw6 (00:f6:63:10:be:7c)   Ethernet1/33      -
                e1b    sw7 (00:f6:63:10:be:7d)   Ethernet1/34      -
                e2a    sw8 (b8:ce:f6:91:3d:88)   Ethernet1/35      -
    Press <space> to page down, <return> for next line, or 'q' to quit...
    10 entries were displayed.
  5. を実行します net show interface 動作中のスイッチに対してコマンドを実行し、ノードとすべてのシェルフの両方が表示されることを確認します。

    net show interface

    例を示します
    cumulus@sw1:~$ net show interface
    
    State  Name    Spd   MTU    Mode        LLDP                  Summary
    -----  ------  ----  -----  ----------  --------------------  --------------------
    ...
    ...
    UP     swp1    100G  9216   Trunk/L2   node1 (e3a)             Master: bridge(UP)
    UP     swp2    100G  9216   Trunk/L2   node2 (e3a)             Master: bridge(UP)
    UP     swp3    100G  9216   Trunk/L2   SHFFG1826000112 (e0b)   Master: bridge(UP)
    UP     swp4    100G  9216   Trunk/L2   SHFFG1826000112 (e0b)   Master: bridge(UP)
    UP     swp5    100G  9216   Trunk/L2   SHFFG1826000102 (e0b)   Master: bridge(UP)
    UP     swp6    100G  9216   Trunk/L2   SHFFG1826000102 (e0b)   Master: bridge(UP))
    ...
    ...
  6. ストレージシステムのシェルフポートを確認します。

    storage shelf port show -fields remote-device, remote-port

    例を示します
    cluster1::*> storage shelf port show -fields remote-device, remote-port
    shelf   id  remote-port   remote-device
    -----   --  -----------   -------------
    3.20    0   swp3          sw1
    3.20    1   -             -
    3.20    2   swp4          sw1
    3.20    3   -             -
    3.30    0   swp5          sw1
    3.20    1   -             -
    3.30    2   swp6          sw1
    3.20    3   -             -
    cluster1::*>
  7. ストレージスイッチSW2に接続されているすべてのケーブルを取り外します。

  8. 交換用スイッチnsw2にすべてのケーブルを再接続します。

  9. ストレージノードポートのヘルスステータスを再確認します。

    storage port show -port-type enet

    例を示します
    cluster1::*> storage port show -port-type ENET
                                        Speed                     VLAN
    Node             Port Type  Mode    (Gb/s) State    Status      ID
    ---------------- ---- ----- ------- ------ -------- --------- ----
    node1
                     e3a  ENET  storage 100    enabled  online      30
                     e3b  ENET  storage   0    enabled  offline     30
                     e7a  ENET  storage   0    enabled  offline     30
                     e7b  ENET  storage 100    enabled  online      30
    node2
                     e3a  ENET  storage 100    enabled  online      30
                     e3b  ENET  storage   0    enabled  offline     30
                     e7a  ENET  storage   0    enabled  offline     30
                     e7b  ENET  storage 100    enabled  online      30
    cluster1::*>
  10. 両方のスイッチが使用可能であることを確認します。

    net device-discovery show -protocol lldp

    例を示します
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface         Platform
    ----------- ------ ------------------------- ----------------  ----------------
    node1/lldp
                e0M    sw1 (00:ea:bd:68:6a:e8)   Eth1/46           -
                e0b    sw2 (6c:b2:ae:5f:a5:b2)   Ethernet1/16      -
                e0c    SHFFG1827000286 (d0:39:ea:1c:16:92)
                                                 e0a               -
                e0e    sw3 (6c:b2:ae:5f:a5:ba)   Ethernet1/18      -
                e0f    SHFFG1827000286 (00:a0:98:fd:e4:a9)
                                                 e0b               -
                e0g    sw4 (28:ac:9e:d5:4a:9c)   Ethernet1/11      -
                e0h    sw5 (6c:b2:ae:5f:a5:ca)   Ethernet1/22      -
                e1a    sw6 (00:f6:63:10:be:7c)   Ethernet1/33      -
                e1b    sw7 (00:f6:63:10:be:7d)   Ethernet1/34      -
                e2a    sw8 (b8:ce:f6:91:3d:88)   Ethernet1/35      -
    Press <space> to page down, <return> for next line, or 'q' to quit...
    10 entries were displayed.
  11. ストレージシステムのシェルフポートを確認します。

    storage shelf port show -fields remote-device, remote-port

    例を示します
    cluster1::*> storage shelf port show -fields remote-device, remote-port
    shelf   id    remote-port     remote-device
    -----   --    -----------     -------------
    3.20    0     swp3            sw1
    3.20    1     swp3            nsw2
    3.20    2     swp4            sw1
    3.20    3     swp4            nsw2
    3.30    0     swp5            sw1
    3.20    1     swp5            nsw2
    3.30    2     swp6            sw1
    3.20    3     swp6            nsw2
    cluster1::*>
  12. 次の2つのコマンドを使用して、スイッチ関連のログファイルを収集するためのイーサネットスイッチヘルスモニタログ収集機能を有効にします。

    'system switch ethernet log setup-password 'および'system switch ethernet log enable-colion

    「 system switch ethernet log setup -password 」と入力します

    例を示します
    cluster1::*> system switch ethernet log setup-password
    Enter the switch name: <return>
    The switch name entered is not recognized.
    Choose from the following list:
    sw1
    nsw2
    
    cluster1::*> system switch ethernet log setup-password
    
    Enter the switch name: sw1
    RSA key fingerprint is e5:8b:c6:dc:e2:18:18:09:36:63:d9:63:dd:03:d9:cc
    Do you want to continue? {y|n}::[n] y
    
    Enter the password: <enter switch password>
    Enter the password again: <enter switch password>
    
    cluster1::*> system switch ethernet log setup-password
    
    Enter the switch name: nsw2
    RSA key fingerprint is 57:49:86:a1:b9:80:6a:61:9a:86:8e:3c:e3:b7:1f:b1
    Do you want to continue? {y|n}:: [n] y
    
    Enter the password: <enter switch password>
    Enter the password again: <enter switch password>

    その後に次のコマンドを入力

    「システムスイッチのイーサネットログの有効化」

    例を示します
    cluster1::*> system  switch ethernet log enable-collection
    
    Do you want to enable cluster log collection for all nodes in the cluster?
    {y|n}: [n] y
    
    Enabling cluster switch log collection.
    
    cluster1::*>
    メモ これらのコマンドのいずれかでエラーが返される場合は、ネットアップサポートにお問い合わせください。
  13. スイッチのログ収集機能をテストします。

    system switch ethernet log collect -device *

    10分間待ってから'次のコマンドを使用してログ収集が成功したことを確認しますsystem switch ethernet log show

    例を示します
    cluster1::*> system switch ethernet log show
    Log Collection Enabled: true
    
    Index  Switch                       Log Timestamp        Status
    ------ ---------------------------- -------------------  ---------    
    1      sw1 (b8:ce:f6:19:1b:42)      4/29/2022 03:05:25   complete   
    2      nsw2 (b8:ce:f6:19:1b:96)     4/29/2022 03:07:42   complete
  14. 権限レベルを admin に戻します。

    「特権管理者」

  15. ケースの自動作成を抑制した場合は、 AutoSupport メッセージを呼び出して作成を再度有効にします。

    「 system node AutoSupport invoke -node * -type all -message MAINT= end 」というメッセージが表示されます