更换NVIDIA SN2100存储交换机
您可以更换有故障的NVIDIA SN2100存储交换机。这是一个无中断操作步骤。
在NVIDIA SN2100存储交换机上安装Cumulus软件和RCF之前、请确保:
-
您的系统可以支持NVIDIA SN2100存储交换机。
-
您已下载适用的RCF。
。 "Hardware Universe" 提供支持的端口及其配置的完整详细信息。
现有网络配置必须具有以下特征:
-
确保已完成所有故障排除步骤,以确认您的交换机需要更换。
-
两台交换机上必须存在管理连接。
确保已完成所有故障排除步骤,以确认您的交换机需要更换。
更换用的NVIDIA SN2100交换机必须具有以下特征:
-
管理网络连接正常。
-
可以通过控制台访问替代交换机。
-
相应的RCF和Cumulus操作系统映像将加载到交换机上。
-
交换机的初始自定义已完成。
此操作步骤 将第二个NVIDIA SN2100存储交换机SW2替换为新的NVIDIA SN2100交换机nsw2。这两个节点分别为 node1 和 node2 。
完成步骤:
-
确认要更换的交换机为SW2。
-
断开交换机SW2的缆线。
-
将缆线重新连接到交换机nsw2。
-
验证交换机nsw2上的所有设备配置。
-
如果在此集群上启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例:
ssystem node AutoSupport invoke -node * -type all - 消息 MAINT=xh
x 是维护时段的持续时间,以小时为单位。
-
将权限级别更改为高级,在系统提示您继续时输入 * y * :
set -privilege advanced
-
检查存储节点端口的运行状况,确保已连接到存储交换机 S1 :
storage port show -port-type ENET
显示示例
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID -------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
-
验证存储交换机sw1是否可用:
network device-discovery show -protocol lldp
显示示例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
-
运行
net show interface
命令确认您可以同时看到节点和所有磁盘架:net show interface
显示示例
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ------ ---- ----- ---------- -------------------- -------------------- ... ... UP swp1 100G 9216 Trunk/L2 node1 (e3a) Master: bridge(UP) UP swp2 100G 9216 Trunk/L2 node2 (e3a) Master: bridge(UP) UP swp3 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 SHFFG1826000112 (e0b) Master: bridge(UP) UP swp5 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP) UP swp6 100G 9216 Trunk/L2 SHFFG1826000102 (e0b) Master: bridge(UP)) ... ...
-
验证存储系统中的磁盘架端口:
storage shelf port show -fields remote-device, remote-port
显示示例
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 - - 3.20 2 swp4 sw1 3.20 3 - - 3.30 0 swp5 sw1 3.20 1 - - 3.30 2 swp6 sw1 3.20 3 - - cluster1::*>
-
拔下连接到存储交换机SW2的所有缆线。
-
将所有缆线重新连接到更换用的交换机nsw2。
-
重新检查存储节点端口的运行状况:
storage port show -port-type ENET
显示示例
cluster1::*> storage port show -port-type ENET Speed VLAN Node Port Type Mode (Gb/s) State Status ID ---------------- ---- ----- ------- ------ -------- --------- ---- node1 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 node2 e3a ENET storage 100 enabled online 30 e3b ENET storage 0 enabled offline 30 e7a ENET storage 0 enabled offline 30 e7b ENET storage 100 enabled online 30 cluster1::*>
-
验证两个交换机是否均可用:
net device-discovery show -protocol lldp
显示示例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1/lldp e0M sw1 (00:ea:bd:68:6a:e8) Eth1/46 - e0b sw2 (6c:b2:ae:5f:a5:b2) Ethernet1/16 - e0c SHFFG1827000286 (d0:39:ea:1c:16:92) e0a - e0e sw3 (6c:b2:ae:5f:a5:ba) Ethernet1/18 - e0f SHFFG1827000286 (00:a0:98:fd:e4:a9) e0b - e0g sw4 (28:ac:9e:d5:4a:9c) Ethernet1/11 - e0h sw5 (6c:b2:ae:5f:a5:ca) Ethernet1/22 - e1a sw6 (00:f6:63:10:be:7c) Ethernet1/33 - e1b sw7 (00:f6:63:10:be:7d) Ethernet1/34 - e2a sw8 (b8:ce:f6:91:3d:88) Ethernet1/35 - Press <space> to page down, <return> for next line, or 'q' to quit... 10 entries were displayed.
-
验证存储系统中的磁盘架端口:
storage shelf port show -fields remote-device, remote-port
显示示例
cluster1::*> storage shelf port show -fields remote-device, remote-port shelf id remote-port remote-device ----- -- ----------- ------------- 3.20 0 swp3 sw1 3.20 1 swp3 nsw2 3.20 2 swp4 sw1 3.20 3 swp4 nsw2 3.30 0 swp5 sw1 3.20 1 swp5 nsw2 3.30 2 swp6 sw1 3.20 3 swp6 nsw2 cluster1::*>
-
将权限级别重新更改为 admin :
set -privilege admin
-
如果禁止自动创建案例,请通过调用 AutoSupport 消息重新启用它:
ssystem node AutoSupport invoke -node * -type all -message MAINT=end
"配置交换机运行状况监控"(英文)