Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

NVIDIA SN2100クラスタスイッチを交換してください

共同作成者

クラスタネットワーク内の不良なNVIDIA SN2100スイッチを交換するには、この手順 に従います。これは、無停止の手順 (NDU;非停止アップグレード)です。

要件を確認

既存のクラスタとネットワークインフラ

次の点を確認します

  • 既存のクラスタは、少なくとも1つのクラスタスイッチが完全に接続された状態で、完全に機能することが確認されています。

  • すべてのクラスタポートが稼働している必要があります

  • すべてのクラスタLIFが、upの状態でホームポートにあることを確認します。

  • ONTAP cluster ping-cluster -node node1 コマンドは、基本的な接続とPMTU以上の通信がすべてのパスで成功したことを示します。

NVIDIA SN2100交換用スイッチ

次の点を確認します

  • 交換用スイッチの管理ネットワーク接続は機能しています。

  • 交換用スイッチへのコンソールアクセスが確立されている。

  • ノード接続は、ポートswp1からswp14です。

  • ポートswp15およびswp16では、すべてのスイッチ間リンク(ISL)ポートが無効になっています。

  • 目的のリファレンス構成ファイル(RCF)とCumulusオペレーティングシステムイメージスイッチがスイッチにロードされます。

  • スイッチの初期カスタマイズが完了しました。

また、STP、SNMP、SSHなどの以前のサイトカスタマイズがすべて新しいスイッチにコピーされていることを確認します。

メモ クラスタ LIF を移行するコマンドは、そのクラスタ LIF がホストされているノードで実行する必要があります。

コンソールログを有効にする

NetAppでは、使用しているデバイスでコンソールロギングをイネーブルにし、スイッチを交換するときに次のアクションを実行することを強く推奨します。

スイッチを交換します

例について

この手順の例では、スイッチとノードで次の命名法を使用しています。

  • 既存のNVIDIA SN2100スイッチの名前は_sw1_AND _sw2_です。

  • 新しいNVIDIA SN2100スイッチの名前は_nsw2_.

  • ノード名は _node1_AND _node2 _ です。

  • 各ノードのクラスタポートの名前は _e3a および _e3b _ です。

  • クラスタLIFの名前は、ノード1の場合は_node1_clus1_AND node1_clus2(1つ)、ノード2の場合は_node2_clus1_and node2_clus2(1つ)です。

  • すべてのクラスタ・ノードへの変更を求めるプロンプトは、'cluster1:*>`です

  • ブレークアウトポートの形式は、SWP[ポート] s [ブレークアウトポート0-3]です。たとえば'swp1の4つのブレークアウトポートは'swp1s0'_swp1s1'_swp1s2s'_swp1s3_です

クラスタネットワークトポロジについて

この手順 は、次のクラスタネットワークトポロジに基づいています。

トポロジの例を表示します
cluster1::*> network port show -ipspace Cluster

Node: node1
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false

Node: node2
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false


cluster1::*> network interface show -vserver Cluster

            Logical    Status     Network            Current       Current Is
Vserver     Interface  Admin/Oper Address/Mask       Node          Port    Home
----------- ---------- ---------- ------------------ ------------- ------- ----
Cluster
            node1_clus1  up/up    169.254.209.69/16  node1         e3a     true
            node1_clus2  up/up    169.254.49.125/16  node1         e3b     true
            node2_clus1  up/up    169.254.47.194/16  node2         e3a     true
            node2_clus2  up/up    169.254.19.183/16  node2         e3b     true


cluster1::*> network device-discovery show -protocol lldp
Node/       Local  Discovered
Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
----------- ------ ------------------------- ------------  ----------------
node1      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp3          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp3          -
node2      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp4          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp4          -

[+]

cumulus@sw1:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw2                e3a
swp4       100G   Trunk/L2    sw2                e3a
swp15      100G   BondMember  sw2                swp15
swp16      100G   BondMember  sw2                swp16


cumulus@sw2:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw1                e3b
swp4       100G   Trunk/L2    sw1                e3b
swp15      100G   BondMember  sw1                swp15
swp16      100G   BondMember  sw1                swp16

手順1:交換の準備をします

  1. このクラスタで AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。

    「 system node AutoSupport invoke -node * -type all -message MAINT= xh 」というメッセージが表示されます

    ここで、 _ x _ はメンテナンス時間の長さ(時間)です。

  2. 権限レベルを advanced に変更します。続行するかどうかを尋ねられたら、「 * y * 」と入力します。

    「 advanced 」の権限が必要です

    advanced のプロンプト( * > )が表示されます。

  3. 適切なRCFとイメージをスイッチnsw2にインストールし、必要なサイトの準備を行います。

    必要に応じて、新しいスイッチ用のRCFおよびCumulusソフトウェアの適切なバージョンを確認、ダウンロード、およびインストールします。

    1. ご使用のクラスタスイッチに適用可能なCumulusソフトウェアは、_nvidia Support_siteからダウンロードできます。ダウンロードページの手順に従って、インストールするONTAP ソフトウェアのバージョンに対応したCumulus Linuxをダウンロードします。

    2. 適切な RCF はから入手できます "NVIDIAクラスタとストレージスイッチ_" ページダウンロードページの手順に従って、インストールする ONTAP ソフトウェアのバージョンに対応する正しい RCF をダウンロードします。

手順2:ポートとケーブルを設定する

  1. 新しいスイッチnsw2にadminとしてログインし、ノードクラスタインターフェイス(ポートswp1からswp14)に接続するすべてのポートをシャットダウンします。

    クラスタノードの LIF は、各ノードのもう一方のクラスタポートにすでにフェイルオーバーされている必要があります。

    例を示します
    cumulus@nsw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  2. クラスタLIFで自動リバートを無効にします。

    network interface modify -vserver Cluster -lif *-auto-revert false

    例を示します
    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false
    
    Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y
  3. すべてのクラスタ LIF で自動リバートが有効になっていることを確認します。

    net interface show -vserver Cluster -fields auto-revert

  4. SN2100スイッチsw1でISLポートswp15およびswp16をシャットダウンします。

    例を示します
    cumulus@sw1:~$ net add interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit
  5. すべてのケーブルをSN2100 sw1スイッチから取り外し、SN2100 nsw2スイッチの同じポートに接続します。

  6. sw1スイッチとnsw2スイッチの間で、ISLポートswp15とswp16を起動します。

    例を示します

    次のコマンドは、スイッチsw1でISLポートswp15およびswp16を有効にします。

    cumulus@sw1:~$ net del interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit

    次の例は、スイッチsw1のISLポートがupになっていることを示しています。

    cumulus@sw1:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------- ----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  nsw2 (swp15)   Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  nsw2 (swp16)   Master: cluster_isl(UP)

    +次の例は、スイッチnsw2のISLポートがupになっていることを示しています。

    [+]

    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------  -----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  sw1 (swp15)    Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)    Master: cluster_isl(UP)
  7. ポートを確認します e3b すべてのノードで動作:

    「 network port show -ipspace cluster 」のように表示されます

    例を示します

    次のような出力が表示されます。

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                             Ignore
                                                       Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ----- ------------ -------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
    
    
    Node: node2
                                                                             Ignore
                                                       Speed(Mbps) Health    Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper  Status    Status
    --------- ------------ ---------------- ---- ----- ----------- --------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
  8. これで、各ノードのクラスタポートは、ノードから見て次のようにクラスタスイッチに接続されました。

    例を示します
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
    ----------- ------ ------------------------- ------------  ----------------
    node1      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp3          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp3          -
    node2      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp4          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp4          -
  9. すべてのノードクラスタポートが動作していることを確認します。

    net show interface

    例を示します
    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP              Summary
    -----  -----------  ----  -----  ----------  ----------------- ----------------------
    ...
    ...
    UP     swp3         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp4         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp15        100G  9216   BondMember  sw1 (swp15)       Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)       Master: cluster_isl(UP)
  10. 両方のノードのそれぞれで、各スイッチに 1 つの接続があることを確認します。

    net show lldp

    例を示します

    次の例は、両方のスイッチの該当する結果を示しています。

    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3a
    swp4       100G   Trunk/L2    node2              e3a
    swp15      100G   BondMember  nsw2               swp15
    swp16      100G   BondMember  nsw2               swp16
    
    
    cumulus@nsw2:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1                e3b
    swp4       100G   Trunk/L2    node2                e3b
    swp15      100G   BondMember  sw1                swp15
    swp16      100G   BondMember  sw1                swp16
  11. クラスタ LIF で自動リバートを有効にします。

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true

  12. スイッチnsw2で、ノードのネットワークポートに接続されているポートを起動します。

    例を示します
    cumulus@nsw2:~$ net del interface swp1-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  13. クラスタ内のノードに関する情報を表示します。

    「 cluster show 」を参照してください

    例を示します

    次の例では、このクラスタのノード node1 と node2 のノードの健常性が true であることを示します。

    cluster1::*> cluster show
    
    Node          Health  Eligibility
    ------------- ------- ------------
    node1         true    true
    node2         true    true
  14. すべての物理クラスタポートが動作していることを確認します。

    「 network port show -ipspace cluster 」のように表示されます

    例を示します
    cluster1::*> network port show -ipspace Cluster
    
    Node node1                                                               Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace     Broadcast Domain  Link  MTU   Admin/Oper  Status   Status
    --------- ----------- ----------------- ----- ----- ----------- -------- ------
    e3a       Cluster     Cluster           up    9000  auto/10000  healthy  false
    e3b       Cluster     Cluster           up    9000  auto/10000  healthy  false
    
    Node: node2
                                                                             Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link  MTU   Admin/Oper  Status   Status
    --------- ------------ ---------------- ----- ----- ----------- -------- ------
    e3a       Cluster      Cluster          up    9000  auto/10000  healthy  false
    e3b       Cluster      Cluster          up    9000  auto/10000  healthy  false

手順3:構成を確認します

  1. クラスタネットワークが正常であることを確認します。

    例を示します
    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost      RemotePort
    ---------  -----  ----------  --------------  -----------
    swp3       100G   Trunk/L2    node1           e3a
    swp4       100G   Trunk/L2    node2           e3a
    swp15      100G   BondMember  nsw2            swp15
    swp16      100G   BondMember  nsw2            swp16
  2. 権限レベルを admin に戻します。

    「特権管理者」

  3. ケースの自動作成を抑制した場合は、 AutoSupport メッセージを呼び出して作成を再度有効にします。

    「 system node AutoSupport invoke -node * -type all -message MAINT= end 」というメッセージが表示されます