更換Cisco Nexus 9336C-FX2 和 9336C-FX2-T 集群交換機
請依照下列步驟更換集群網路中有缺陷的 Nexus 9336C-FX2 和 9336C-FX2-T 交換器。這是一個無中斷程式 (NDU)。
審查要求
更換開關之前,請確保:
-
您已確認交換器序號,以確保更換的是正確的交換器。
-
在現有集群和網路基礎設施的基礎上:
-
現有集群已驗證功能完全正常,至少有一個完全連接的集群交換器。
-
叢集所有連接埠均已啟動。
-
所有群集邏輯介面(LIF)均已啟動並位於其所屬連接埠上。
-
ONTAP `cluster ping-cluster -node node1`命令必須表示所有路徑上的基本連接和大於 PMTU 的通訊均已成功。
-
-
在 Nexus 9336C-FX2 替換交換器上:
-
替換交換器的管理網路連線功能正常。
-
已具備對替換開關的控制台存取權限。
-
節點連接是連接埠 1/1 至 1/34。
-
連接埠 1/35 和 1/36 上的所有交換器間連結 (ISL) 連接埠均停用。
-
將所需的參考設定檔 (RCF) 和 NX-OS 作業系統映像交換器載入到交換器上。
-
交換器的初始客製化工作已完成,詳情如下:"配置 9336C-FX2 集群交換機" 。
先前站點的所有自訂設置,如 STP、SNMP 和 SSH,都會複製到新交換器上。
-
-
您已執行將叢集 LIF 從其所在的節點遷移的命令。
啟用控制台日誌記錄
NetApp強烈建議您在使用的裝置上啟用控制台日誌記錄,並在更換交換器時執行以下操作:
-
維護期間請保持AutoSupport功能啟用。
-
在維護前後觸發維護AutoSupport,以在維護期間停用案例建立。請參考這篇知識庫文章 "SU92:如何在計劃維護視窗期間抑制自動建立案例"更多詳情請見下文。
-
啟用所有 CLI 會話的會話日誌記錄。有關如何啟用會話日誌記錄的說明,請查看此知識庫文章中的「記錄會話輸出」部分。 "如何配置 PuTTY 以獲得與ONTAP系統的最佳連接" 。
更換開關
本流程中的範例使用以下開關和節點命名規則:
-
現有的 Nexus 9336C-FX2 交換器的名稱為 cs1 和 cs2。
-
新的 Nexus 9336C-FX2 交換器的名稱是 newcs2。
-
節點名稱分別為 node1 和 node2。
-
每個節點上的叢集連接埠分別命名為 e0a 和 e0b。
-
節點 1 的群集 LIF 位稱為 node1_clus1 和 node1_clus2,節點 2 的群集 LIF 位稱為 node2_clus1 和 node2_clus2。
-
對所有叢集節點進行變更的提示是 cluster1::*>
以下步驟基於以下叢集網路拓撲結構:
顯示範例
cluster1::*> network port show -ipspace Cluster
Node: node1
Ignore
Speed(Mbps) Health Health
Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status
--------- ------------ ---------------- ---- ---- ----------- -------- ------
e0a Cluster Cluster up 9000 auto/10000 healthy false
e0b Cluster Cluster up 9000 auto/10000 healthy false
Node: node2
Ignore
Speed(Mbps) Health Health
Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status
--------- ------------ ---------------- ---- ---- ----------- -------- ------
e0a Cluster Cluster up 9000 auto/10000 healthy false
e0b Cluster Cluster up 9000 auto/10000 healthy false
4 entries were displayed.
cluster1::*> network interface show -vserver Cluster
Logical Status Network Current Current Is
Vserver Interface Admin/Oper Address/Mask Node Port Home
----------- ---------- ---------- ------------------ ------------- ------- ----
Cluster
node1_clus1 up/up 169.254.209.69/16 node1 e0a true
node1_clus2 up/up 169.254.49.125/16 node1 e0b true
node2_clus1 up/up 169.254.47.194/16 node2 e0a true
node2_clus2 up/up 169.254.19.183/16 node2 e0b true
4 entries were displayed.
cluster1::*> network device-discovery show -protocol cdp
Node/ Local Discovered
Protocol Port Device (LLDP: ChassisID) Interface Platform
----------- ------ ------------------------- ---------------- ----------------
node2 /cdp
e0a cs1 Eth1/2 N9K-C9336C
e0b cs2 Eth1/2 N9K-C9336C
node1 /cdp
e0a cs1 Eth1/1 N9K-C9336C
e0b cs2 Eth1/1 N9K-C9336C
4 entries were displayed.
cs1# show cdp neighbors
Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge
S - Switch, H - Host, I - IGMP, r - Repeater,
V - VoIP-Phone, D - Remotely-Managed-Device,
s - Supports-STP-Dispute
Device-ID Local Intrfce Hldtme Capability Platform Port ID
node1 Eth1/1 144 H FAS2980 e0a
node2 Eth1/2 145 H FAS2980 e0a
cs2 Eth1/35 176 R S I s N9K-C9336C Eth1/35
cs2(FDO220329V5) Eth1/36 176 R S I s N9K-C9336C Eth1/36
Total entries displayed: 4
cs2# show cdp neighbors
Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge
S - Switch, H - Host, I - IGMP, r - Repeater,
V - VoIP-Phone, D - Remotely-Managed-Device,
s - Supports-STP-Dispute
Device-ID Local Intrfce Hldtme Capability Platform Port ID
node1 Eth1/1 139 H FAS2980 e0b
node2 Eth1/2 124 H FAS2980 e0b
cs1 Eth1/35 178 R S I s N9K-C9336C Eth1/35
cs1 Eth1/36 178 R S I s N9K-C9336C Eth1/36
Total entries displayed: 4
第一步:準備更換
-
如果此叢集上啟用了AutoSupport ,則透過呼叫AutoSupport訊息來抑制自動建立案例:
system node autosupport invoke -node * -type all -message MAINT=xh其中 x 為維護窗口的持續時間(小時)。
AutoSupport訊息會通知技術支援此維護任務,以便在維護視窗期間抑制自動建立案例。 -
在交換器上安裝對應的 RCF 和映像,newcs2,並進行任何必要的現場準備。
如有必要,請驗證、下載並安裝適用於新交換器的 RCF 和 NX-OS 軟體的相應版本。如果您已確認新交換器設定正確,且不需要更新 RCF 和 NX-OS 軟體,請繼續執行步驟 2。
-
前往NetApp支援網站上的 NetApp 叢集和管理網路交換器參考設定檔說明頁面。
-
點擊連結查看“叢集網路和管理網路相容性矩陣”,然後記下所需的交換器軟體版本。
-
點擊瀏覽器後退箭頭返回描述頁面,點擊*繼續*,接受許可協議,然後前往下載頁面。
-
請依照下載頁面上的步驟,下載與您要安裝的ONTAP軟體版本相對應的正確 RCF 和 NX-OS 檔案。
-
-
在新交換器上,以管理員身分登入並關閉所有將連接到節點叢集介面的連接埠(連接埠 1/1 到 1/34)。
如果您要更換的開關無法正常運作且已斷電,請轉到步驟 4。叢集節點上的 LIF 應該已經針對每個節點故障轉移到另一個叢集連接埠。
顯示範例
newcs2# config Enter configuration commands, one per line. End with CNTL/Z. newcs2(config)# interface e1/1-34 newcs2(config-if-range)# shutdown
-
確認所有叢集 LIF 都已啟用自動回滾功能:
network interface show -vserver Cluster -fields auto-revert顯示範例
cluster1::> network interface show -vserver Cluster -fields auto-revert Logical Vserver Interface Auto-revert ------------ ------------- ------------- Cluster node1_clus1 true Cluster node1_clus2 true Cluster node2_clus1 true Cluster node2_clus2 true 4 entries were displayed. -
驗證遠端集群介面的連接性:
你可以使用 `network interface check cluster-connectivity`執行命令以啟動叢集連接性檢查,然後顯示詳細資訊:
network interface check cluster-connectivity start`和 `network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
*注意:*運行程式前請等待幾秒鐘 `show`顯示詳細資訊的命令。
cluster1::*> network interface check cluster-connectivity show
Source Destination Packet
Node Date LIF LIF Loss
------ -------------------------- ---------------- ---------------- -----------
node1
3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none
3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none
node2
3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none
3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
對於所有ONTAP版本,您也可以使用 `cluster ping-cluster -node <name>`檢查連接性的命令:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local Host is node2 Getting addresses from network interface table... Cluster node1_clus1 169.254.209.69 node1 e0a Cluster node1_clus2 169.254.49.125 node1 e0b Cluster node2_clus1 169.254.47.194 node2 e0a Cluster node2_clus2 169.254.19.183 node2 e0b Local = 169.254.47.194 169.254.19.183 Remote = 169.254.209.69 169.254.49.125 Cluster Vserver Id = 4294967293 Ping status: .... Basic connectivity succeeds on 4 path(s) Basic connectivity fails on 0 path(s) ................ Detected 9000 byte MTU on 4 path(s): Local 169.254.47.194 to Remote 169.254.209.69 Local 169.254.47.194 to Remote 169.254.49.125 Local 169.254.19.183 to Remote 169.254.209.69 Local 169.254.19.183 to Remote 169.254.49.125 Larger than PMTU communication succeeds on 4 path(s) RPC status: 2 paths up, 0 paths down (tcp check) 2 paths up, 0 paths down (udp check)
步驟 2:設定線纜和連接埠
-
關閉 Nexus 9336C-FX2 交換器 cs1 上的 ISL 連接埠 1/35 和 1/36。
顯示範例
cs1# configure Enter configuration commands, one per line. End with CNTL/Z. cs1(config)# interface e1/35-36 cs1(config-if-range)# shutdown cs1(config-if-range)#
-
從 Nexus 9336C-FX2 cs2 交換器上拔下所有電纜,然後將它們連接到 Nexus C9336C-FX2 newcs2 交換器上的相同連接埠。
-
在 cs1 和 newcs2 交換器之間啟動 ISL 連接埠 1/35 和 1/36,然後驗證連接埠通道運作狀態。
Port-Channel 應指示 Po1(SU),成員連接埠應指示 Eth1/35(P) 和 Eth1/36(P)。
顯示範例
此範例啟用 ISL 連接埠 1/35 和 1/36 並顯示交換器 cs1 上的連接埠通道摘要:
cs1# configure Enter configuration commands, one per line. End with CNTL/Z. cs1(config)# int e1/35-36 cs1(config-if-range)# no shutdown cs1(config-if-range)# show port-channel summary Flags: D - Down P - Up in port-channel (members) I - Individual H - Hot-standby (LACP only) s - Suspended r - Module-removed b - BFD Session Wait S - Switched R - Routed U - Up (port-channel) p - Up in delay-lacp mode (member) M - Not in use. Min-links not met -------------------------------------------------------------------------------- Group Port- Type Protocol Member Ports Channel -------------------------------------------------------------------------------- 1 Po1(SU) Eth LACP Eth1/35(P) Eth1/36(P) cs1(config-if-range)# -
驗證所有節點上的連接埠 e0b 是否已啟動:
network port show ipspace Cluster顯示範例
輸出結果應類似以下內容:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- -------- ------- e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- -------- ------- e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/auto - false 4 entries were displayed. -
在上一個步驟中使用的相同節點上,使用 network interface revert 指令還原與上一個步驟中的連接埠關聯的叢集 LIF。
顯示範例
在本例中,如果 Home 值為 true 且連接埠為 e0b,則節點 1 上的 LIF node1_clus2 將成功還原。
以下命令返回 LIF `node1_clus2`在 `node1`回到母港 `e0a`並顯示有關兩個節點上 LIF 的資訊。如果兩個叢集介面的「是否為 Home」列均為 true,且它們顯示正確的連接埠分配,則表示第一個節點啟動成功。 `e0a`和 `e0b`在節點1上。
cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ------------ ---------- ------------------ ---------- ------- ----- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e0a true node1_clus2 up/up 169.254.49.125/16 node1 e0b true node2_clus1 up/up 169.254.47.194/16 node2 e0a true node2_clus2 up/up 169.254.19.183/16 node2 e0a false 4 entries were displayed. -
顯示叢集中節點的相關資訊:
cluster show顯示範例
此範例表明,該叢集中節點 1 和節點 2 的節點健康狀況為真:
cluster1::*> cluster show Node Health Eligibility ------------- ------- ------------ node1 false true node2 true true
-
確認所有實體叢集連接埠均已啟動:
network port show ipspace Cluster顯示範例
cluster1::*> network port show -ipspace Cluster Node node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ----------------- ----- ----- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ----- ----- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false 4 entries were displayed. -
驗證遠端集群介面的連接性:
你可以使用 `network interface check cluster-connectivity`執行命令以啟動叢集連接性檢查,然後顯示詳細資訊:
network interface check cluster-connectivity start`和 `network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
*注意:*運行程式前請等待幾秒鐘 `show`顯示詳細資訊的命令。
cluster1::*> network interface check cluster-connectivity show
Source Destination Packet
Node Date LIF LIF Loss
------ -------------------------- ---------------- ---------------- -----------
node1
3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none
3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none
node2
3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none
3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
對於所有ONTAP版本,您也可以使用 `cluster ping-cluster -node <name>`檢查連接性的命令:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local Host is node2 Getting addresses from network interface table... Cluster node1_clus1 169.254.209.69 node1 e0a Cluster node1_clus2 169.254.49.125 node1 e0b Cluster node2_clus1 169.254.47.194 node2 e0a Cluster node2_clus2 169.254.19.183 node2 e0b Local = 169.254.47.194 169.254.19.183 Remote = 169.254.209.69 169.254.49.125 Cluster Vserver Id = 4294967293 Ping status: .... Basic connectivity succeeds on 4 path(s) Basic connectivity fails on 0 path(s) ................ Detected 9000 byte MTU on 4 path(s): Local 169.254.47.194 to Remote 169.254.209.69 Local 169.254.47.194 to Remote 169.254.49.125 Local 169.254.19.183 to Remote 169.254.209.69 Local 169.254.19.183 to Remote 169.254.49.125 Larger than PMTU communication succeeds on 4 path(s) RPC status: 2 paths up, 0 paths down (tcp check) 2 paths up, 0 paths down (udp check)
步驟 3:驗證配置
-
請確認以下叢集網路配置:
network port show顯示範例
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ---------------- ---- ----- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false 4 entries were displayed. cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e0a true node1_clus2 up/up 169.254.49.125/16 node1 e0b true node2_clus1 up/up 169.254.47.194/16 node2 e0a true node2_clus2 up/up 169.254.19.183/16 node2 e0b true 4 entries were displayed. cluster1::> network device-discovery show -protocol cdp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node2 /cdp e0a cs1 0/2 N9K-C9336C e0b newcs2 0/2 N9K-C9336C node1 /cdp e0a cs1 0/1 N9K-C9336C e0b newcs2 0/1 N9K-C9336C 4 entries were displayed. cs1# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 144 H FAS2980 e0a node2 Eth1/2 145 H FAS2980 e0a newcs2 Eth1/35 176 R S I s N9K-C9336C Eth1/35 newcs2 Eth1/36 176 R S I s N9K-C9336C Eth1/36 Total entries displayed: 4 cs2# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 139 H FAS2980 e0b node2 Eth1/2 124 H FAS2980 e0b cs1 Eth1/35 178 R S I s N9K-C9336C Eth1/35 cs1 Eth1/36 178 R S I s N9K-C9336C Eth1/36 Total entries displayed: 4 -
如果您已停用自動建立案例功能,請透過呼叫AutoSupport訊息重新啟用該功能:
system node autosupport invoke -node * -type all -message MAINT=END
更換開關後,您可以 "配置交換器健康監控"。