更換NVIDIA SN2100 儲存交換機
您可以更換有缺陷的NVIDIA SN2100 儲存交換器。這是一個非破壞性的過程。
在NVIDIA SN2100 儲存交換器上安裝 Cumulus 軟體和 RCF 之前,請確保:
-
您的系統可以支援NVIDIA SN2100 儲存交換器。
-
您已下載適用的 RCF 檔案。
這 "Hardware Universe"提供所支援的連接埠及其配置的完整詳細資訊。
現有網路配置必須具備以下特徵:
-
完成所有故障排除步驟,以確認是否需要更換交換器。
-
確保兩台交換器都具備管理連線。
請確保已完成所有故障排除步驟,以確認您的交換器需要更換。
替換用的NVIDIA SN2100交換器必須具備以下特性:
-
管理網路連線正常。
-
您可以使用控制台存取替換交換器。
-
將對應的 RCF 和 Cumulus 作業系統映像載入到交換器上。
-
交換器的初始定制已完成。
此程序將第二個NVIDIA SN2100 儲存交換器 sw2 替換為新的NVIDIA SN2100 交換器 nsw2。這兩個節點分別是節點1和節點2。
完成步驟:
-
確認要更換的開關是 sw2。
-
斷開交換器sw2上的電纜。
-
重新連接電纜至交換器 nsw2。
-
請核實交換器 nsw2 上的所有設備配置。
-
如果此叢集上啟用了AutoSupport ,則透過呼叫AutoSupport訊息來抑制自動建立案例:
system node autosupport invoke -node * -type all - message MAINT=xhx 是維護視窗的持續時間,單位為小時。
-
將權限級別變更為高級,並在提示繼續時輸入 y:
set -privilege advanced -
檢查儲存節點連接埠的健康狀態,以確認與儲存交換器S1的連線:
storage port show -port-type ENET顯示範例
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID -------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*> -
確認儲存交換器sw1是否可用:
network device-discovery show -protocol lldp顯示範例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed. -
運行 `net show interface`在工作交換器上執行指令,確認可以看到兩個節點和所有機架:
net show interface顯示範例
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ------ ---- ----- ---------- -------------------- -------------------- ... ... UP swp1 100G 9216 Trunk/L2 node1 (e3a) Master: bridge(UP) UP swp2 100G 9216 Trunk/L2 node2 (e3a) Master: bridge(UP) UP swp3 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp5 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP) UP swp6 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP)) ... ...
-
檢查儲存系統中的貨架連接埠:
storage shelf port show -fields remote-device, remote-port顯示範例
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 - - 3.20 2 swp4 sw1 3.20 3 - - 3.30 0 swp5 sw1 3.20 1 - - 3.30 2 swp6 sw1 3.20 3 - - cluster1::*>
-
移除連接到儲存交換器sw2的所有電纜。
-
將所有電纜重新連接到替換交換器 nsw2。
-
請重新檢查儲存節點連接埠的運作狀況:
storage port show -port-type ENET顯示範例
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID ---------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*> -
確認兩台交換器均可用:
net device-discovery show -protocol lldp顯示範例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed. -
檢查儲存系統中的貨架連接埠:
storage shelf port show -fields remote-device, remote-port顯示範例
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 swp3 nsw2 3.20 2 swp4 sw1 3.20 3 swp4 nsw2 3.30 0 swp5 sw1 3.20 1 swp5 nsw2 3.30 2 swp6 sw1 3.20 3 swp6 nsw2 cluster1::*>
-
將權限等級改回管理員:
set -privilege admin -
如果您已停用自動建立案例功能,請透過呼叫AutoSupport訊息重新啟用該功能:
system node autosupport invoke -node * -type all -message MAINT=END
更換開關後,您可以 "配置交換器健康監控"。