Skip to main content
Cluster and storage switches
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換NVIDIA SN2100叢集交換器

貢獻者

請遵循此程序、在叢集網路中更換故障的NVIDIA SN2100交換器。這是不中斷營運的程序(NDU)。

檢閱要求

現有的叢集與網路基礎架構

確保:

  • 現有的叢集已通過驗證為完全正常運作、至少有一個完全連接的叢集交換器。

  • 所有叢集連接埠均已啟動。

  • 所有叢集邏輯介面(LIF)都在其主連接埠上。

  • The The ONTAP cluster ping-cluster -node node1 Command表示所有路徑上的基本連線能力和大於PMTU的通訊均成功。

NVIDIA SN2100替換交換器

確保:

  • 替換交換器上的管理網路連線功能正常。

  • 更換交換器的主控台存取已就緒。

  • 節點連線是連接埠swp1到swp14。

  • 所有交換器間連結(ISL)連接埠都會停用swp15和swp16上的連接埠。

  • 所需的參考組態檔(RCF)和Cummuls作業系統映像交換器會載入。

  • 交換器的初始自訂已完成。

此外、請務必將任何先前的站台自訂項目(例如STP、SNMP和SSH)複製到新交換器。

註 您必須執行命令、從裝載叢集LIF的節點移轉叢集LIF。

更換交換器

關於範例

本程序中的範例使用下列交換器和節點命名法:

  • 現有NVIDIA SN2100交換器的名稱為_sw1_和_SW2_。

  • 新NVIDIA SN2100交換器的名稱為_nsw2_。

  • 節點名稱是_node1_和_node2_。

  • 每個節點上的叢集連接埠名稱為_e3a_和_e3c_。

  • 叢集LIF名稱為節點1的_node1_clus1_和節點1的_node1_clus2_、節點2的節點2為_node2_clus1_和節點2為_node2_clus2_。

  • 對所有叢集節點進行變更的提示是「cluster1:*>」

  • 中斷連接埠的格式為:swp[port] s[中斷 連接埠0-3]。例如、swp1上的四個中斷連接埠分別是_swp1s0_、swp1s1swp1s2_和_swp1s3

關於叢集網路拓撲

此程序以下列叢集網路拓撲為基礎:

顯示拓撲範例
cluster1::*> network port show -ipspace Cluster

Node: node1
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false

Node: node2
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false


cluster1::*> network interface show -vserver Cluster

            Logical    Status     Network            Current       Current Is
Vserver     Interface  Admin/Oper Address/Mask       Node          Port    Home
----------- ---------- ---------- ------------------ ------------- ------- ----
Cluster
            node1_clus1  up/up    169.254.209.69/16  node1         e3a     true
            node1_clus2  up/up    169.254.49.125/16  node1         e3b     true
            node2_clus1  up/up    169.254.47.194/16  node2         e3a     true
            node2_clus2  up/up    169.254.19.183/16  node2         e3b     true


cluster1::*> network device-discovery show -protocol lldp
Node/       Local  Discovered
Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
----------- ------ ------------------------- ------------  ----------------
node1      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp3          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp3          -
node2      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp4          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp4          -

+

cumulus@sw1:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw2                e3a
swp4       100G   Trunk/L2    sw2                e3a
swp15      100G   BondMember  sw2                swp15
swp16      100G   BondMember  sw2                swp16


cumulus@sw2:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw1                e3b
swp4       100G   Trunk/L2    sw1                e3b
swp15      100G   BondMember  sw1                swp15
swp16      100G   BondMember  sw1                swp16

步驟1:準備更換

  1. 如果AutoSupport 此叢集啟用了「支援」功能、請叫用AutoSupport 下列訊息來禁止自動建立案例:

    「系統節點AutoSupport 不完整地叫用節點*-type all -Message MAn=xh」

    其中_x_是維護時段的持續時間(以小時為單位)。

  2. 將權限等級變更為進階、並在系統提示您繼續時輸入* y*:

    "進階權限"

    出現進階提示(*>)。

  3. 在交換器nsw2上安裝適當的RCF和映像、並進行必要的站台準備。

    如有必要、請為新交換器驗證、下載及安裝適當版本的RCF和Cummuls軟體。

    1. 您可以從_NVIDIA Support_網站下載適用於叢集交換器的Cummulus軟體。請依照下載頁面上的步驟、下載您ONTAP 所安裝之版本的Cummuls Linux。

    2. 您可從取得適當的RCF "NVIDIA叢集與儲存交換器" 頁面。請依照下載頁面上的步驟、針對ONTAP 您要安裝的版本、下載正確的RCF。

步驟2:設定連接埠和纜線

  1. 在新的交換器nsw2上、以admin身分登入、並關閉所有連接至節點叢集介面的連接埠(連接埠swp1至swp14)。

    叢集節點上的LIF應已容錯移轉至每個節點的其他叢集連接埠。

    顯示範例
    cumulus@nsw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  2. 停用叢集生命體上的自動還原:

    「網路介面修改-vserver叢集-lIF *-auta-fRevert假」

    顯示範例
    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false
    
    Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y
  3. 確認所有叢集生命體均已啟用自動還原:

    net interface show -vserver Cluster -fields auto-revert

  4. 關閉SN2100交換器sw1上的ISL連接埠swp15和swp16。

    顯示範例
    cumulus@sw1:~$ net add interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit
  5. 從SN2100 sw1交換器拔下所有纜線、然後將其連接至SN2100 nsw2交換器上的相同連接埠。

  6. 在sw1和nsw2交換器之間啟動ISL連接埠swp15和swp16。

    顯示範例

    下列命令可啟用交換器sw1上的ISL連接埠swp15和swp16:

    cumulus@sw1:~$ net del interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit

    下列範例顯示交換器sw1上的ISL連接埠為開啟:

    cumulus@sw1:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------- ----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  nsw2 (swp15)   Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  nsw2 (swp16)   Master: cluster_isl(UP)

    +以下範例顯示交換器nsw2上的ISL連接埠為開啟狀態:

    +

    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------  -----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  sw1 (swp15)    Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)    Master: cluster_isl(UP)
  7. 驗證該連接埠 e3b 在所有節點上都啟動:

    「網路連接埠show -IPSpace Cluster」

    顯示範例

    輸出應類似於下列內容:

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                             Ignore
                                                       Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ----- ------------ -------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
    
    
    Node: node2
                                                                             Ignore
                                                       Speed(Mbps) Health    Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper  Status    Status
    --------- ------------ ---------------- ---- ----- ----------- --------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
  8. 從節點的觀點來看、每個節點上的叢集連接埠現在都以下列方式連接至叢集交換器:

    顯示範例
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
    ----------- ------ ------------------------- ------------  ----------------
    node1      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp3          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp3          -
    node2      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp4          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp4          -
  9. 驗證所有節點叢集連接埠是否正常運作:

    net show interface

    顯示範例
    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP              Summary
    -----  -----------  ----  -----  ----------  ----------------- ----------------------
    ...
    ...
    UP     swp3         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp4         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp15        100G  9216   BondMember  sw1 (swp15)       Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)       Master: cluster_isl(UP)
  10. 驗證兩個節點各自與每個交換器都有一個連線:

    net show lldp

    顯示範例

    以下範例顯示兩個交換器的適當結果:

    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3a
    swp4       100G   Trunk/L2    node2              e3a
    swp15      100G   BondMember  nsw2               swp15
    swp16      100G   BondMember  nsw2               swp16
    
    
    cumulus@nsw2:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1                e3b
    swp4       100G   Trunk/L2    node2                e3b
    swp15      100G   BondMember  sw1                swp15
    swp16      100G   BondMember  sw1                swp16
  11. 在叢集生命體上啟用自動還原:

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true

  12. 在交換器nsw2上、開啟連接至節點網路連接埠的連接埠。

    顯示範例
    cumulus@nsw2:~$ net del interface swp1-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  13. 顯示叢集中節點的相關資訊:

    「叢集展示」

    顯示範例

    此範例顯示此叢集中節點1和節點2的節點健全狀況為真:

    cluster1::*> cluster show
    
    Node          Health  Eligibility
    ------------- ------- ------------
    node1         true    true
    node2         true    true
  14. 驗證所有實體叢集連接埠是否正常運作:

    「網路連接埠顯示IPSpace叢集」

    顯示範例
    cluster1::*> network port show -ipspace Cluster
    
    Node node1                                                               Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace     Broadcast Domain  Link  MTU   Admin/Oper  Status   Status
    --------- ----------- ----------------- ----- ----- ----------- -------- ------
    e3a       Cluster     Cluster           up    9000  auto/10000  healthy  false
    e3b       Cluster     Cluster           up    9000  auto/10000  healthy  false
    
    Node: node2
                                                                             Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link  MTU   Admin/Oper  Status   Status
    --------- ------------ ---------------- ----- ----- ----------- -------- ------
    e3a       Cluster      Cluster          up    9000  auto/10000  healthy  false
    e3b       Cluster      Cluster          up    9000  auto/10000  healthy  false

步驟3:完成程序

  1. 驗證叢集網路是否正常。

    顯示範例
    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost      RemotePort
    ---------  -----  ----------  --------------  -----------
    swp3       100G   Trunk/L2    node1           e3a
    swp4       100G   Trunk/L2    node2           e3a
    swp15      100G   BondMember  nsw2            swp15
    swp16      100G   BondMember  nsw2            swp16
  2. 為乙太網路交換器健全狀況監視器記錄收集功能建立密碼:

    「系統交換器乙太網路記錄設定密碼」

    顯示範例
    cluster1::*> system switch ethernet log setup-password
    Enter the switch name: <return>
    The switch name entered is not recognized.
    Choose from the following list:
    cs1
    cs2
    
    cluster1::*> system switch ethernet log setup-password
    
    Enter the switch name: cs1
    Would you like to specify a user other than admin for log collection? {y|n}: n
    
    Enter the password: <enter switch password>
    Enter the password again: <enter switch password>
    
    cluster1::*> system switch ethernet log setup-password
    
    Enter the switch name: cs2
    Would you like to specify a user other than admin for log collection? {y|n}: n
    
    Enter the password: <enter switch password>
    Enter the password again: <enter switch password>
  3. 啟用乙太網路交換器健全狀況監視器記錄收集功能。

    system switch ethernet log modify -device <switch-name> -log-request true

    顯示範例
    cluster1::*> system switch ethernet log modify -device cs1 -log-request true
    
    Do you want to modify the cluster switch log collection configuration? {y|n}: [n] y
    
    Enabling cluster switch log collection.
    
    cluster1::*> system switch ethernet log modify -device cs2 -log-request true
    
    Do you want to modify the cluster switch log collection configuration? {y|n}: [n] y
    
    Enabling cluster switch log collection.

    等待 10 分鐘、然後檢查記錄收集是否完成:

    system switch ethernet log show

    顯示範例
    cluster1::*> system switch ethernet log show
    Log Collection Enabled: true
    
    Index  Switch                       Log Timestamp        Status
    ------ ---------------------------- -------------------  ---------    
    1      cs1 (b8:ce:f6:19:1b:42)      4/29/2022 03:05:25   complete   
    2      cs2 (b8:ce:f6:19:1b:96)      4/29/2022 03:07:42   complete
    警告 如果這些命令中有任何一個傳回錯誤、或記錄集合未完成、請聯絡 NetApp 支援部門。
  4. 將權限層級變更回管理:

    「et -priv. admin」

  5. 如果您禁止自動建立個案、請叫用AutoSupport 下列訊息來重新啟用:

    「系統節點AutoSupport 不完整地叫用節點*-type all -most MAn=end」