将 CN1610 集群交换机迁移到NVIDIA SN2100 集群交换机
您可以将用于ONTAP集群的NetApp CN1610 集群交换机迁移到NVIDIA SN2100 集群交换机。这是一个非破坏性的过程。
审查要求
当您用NVIDIA SN2100 集群交换机替换NetApp CN1610 集群交换机时,您必须了解某些配置信息、端口连接和布线要求。看"NVIDIA SN2100交换机的安装和配置概述"。
支持以下集群交换机:
-
NetApp CN1610
-
NVIDIA SN2100
有关支持的端口及其配置的详细信息,请参阅 "Hardware Universe"。
请确认您的配置满足以下要求:
-
现有集群已正确设置并正常运行。
-
为确保运行不中断,所有集群端口均处于*开启*状态。
-
NVIDIA SN2100 集群交换机已配置并运行在正确版本的 Cumulus Linux 下,并应用了参考配置文件 (RCF)。
-
现有集群网络配置如下:
-
使用 CN1610 交换机的冗余且功能齐全的NetApp集群。
-
对 CN1610 交换机和新交换机的管理连接和控制台访问。
-
所有集群 LIF 均处于启动状态,且集群 LIF 均位于其主端口上。
-
ISL 端口已启用,CN1610 交换机之间以及新交换机之间已连接电缆。
-
-
NVIDIA SN2100 交换机上的一些端口配置为以 40GbE 或 100GbE 运行。
-
您已规划、迁移并记录了从节点到NVIDIA SN2100 集群交换机的 40GbE 和 100GbE 连接。
迁移交换机
本流程中的示例使用以下开关和节点命名规则:
-
现有的 CN1610 集群交换机是 c1 和 c2。
-
新的NVIDIA SN2100 集群交换机是 sw1 和 sw2。
-
节点分别为 node1 和 node2。
-
节点 1 上的集群 LIF 分别为 node1_clus1 和 node1_clus2,节点 2 上的集群 LIF 分别为 node2_clus1 和 node2_clus2。
-
这 `cluster1::*>`prompt 指示集群名称。
-
此过程中使用的集群端口为 e3a 和 e3b。
-
分支端口采用以下格式:swp[端口]s[分支端口 0-3]。例如,swp1 上的四个分支端口分别是 swp1s0、swp1s1、swp1s2 和 swp1s3。
本流程涵盖以下情况:
-
首先将交换机 c2 替换为交换机 sw2。
-
关闭集群节点的端口。为避免集群不稳定,所有端口必须同时关闭。
-
然后断开节点与 c2 之间的电缆与 c2 的连接,并重新连接到 sw2。
-
-
交换机 c1 被交换机 sw1 替换。
-
关闭集群节点的端口。为避免集群不稳定,所有端口必须同时关闭。
-
然后断开节点与 c1 之间的电缆与 c1 的连接,并重新连接到 sw1。
-
|
|
在此过程中不需要任何可操作的交换机间链路 (ISL)。这是设计使然,因为 RCF 版本的更改可能会暂时影响 ISL 连接。为确保集群运行不中断,以下步骤将所有集群 LIF 迁移到运行伙伴交换机,同时在目标交换机上执行相应步骤。 |
步骤 1:准备迁移
-
如果此集群上启用了AutoSupport ,则通过调用AutoSupport消息来抑制自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=xh其中 x 为维护窗口的持续时间(小时)。
-
将权限级别更改为高级,并在提示继续时输入 y:
set -privilege advanced出现高级提示符(*>)。
-
禁用集群 LIF 的自动回滚功能:
network interface modify -vserver Cluster -lif * -auto-revert false
步骤二:配置端口和线缆
-
确定每个集群接口的管理或运行状态。
每个端口都应该显示出来。
Link`和 `healthy`为了 `Health Status。-
显示网络端口属性:
network port show -ipspace Cluster显示示例
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
显示有关 LIF 及其指定归属节点的信息:
network interface show -vserver Cluster每个 LIF 都应显示
up/up`为了 `Status Admin/Oper`和 `true`为了 `Is Home。
显示示例
cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ----------- ---------- ------------------ ----------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true -
-
从节点的角度来看,每个节点上的集群端口通过以下命令以如下方式连接到现有的集群交换机:
network device-discovery show -protocol显示示例
cluster1::*> network device-discovery show -protocol cdp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1 /cdp e3a c1 (6a:ad:4f:98:3b:3f) 0/1 - e3b c2 (6a:ad:4f:98:4c:a4) 0/1 - node2 /cdp e3a c1 (6a:ad:4f:98:3b:3f) 0/2 - e3b c2 (6a:ad:4f:98:4c:a4) 0/2 - -
集群端口和交换机通过以下命令连接(从交换机的角度来看):
show cdp neighbors显示示例
c1# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 0/1 124 H AFF-A400 e3a node2 0/2 124 H AFF-A400 e3a c2 0/13 179 S I s CN1610 0/13 c2 0/14 175 S I s CN1610 0/14 c2 0/15 179 S I s CN1610 0/15 c2 0/16 175 S I s CN1610 0/16 c2# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 0/1 124 H AFF-A400 e3b node2 0/2 124 H AFF-A400 e3b c1 0/13 175 S I s CN1610 0/13 c1 0/14 175 S I s CN1610 0/14 c1 0/15 175 S I s CN1610 0/15 c1 0/16 175 S I s CN1610 0/16 -
验证远程集群接口的连接性:
你可以使用 `network interface check cluster-connectivity`执行命令以启动集群连接性检查,然后显示详细信息:
network interface check cluster-connectivity start`和 `network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
*注意:*运行程序前请等待几秒钟 `show`显示详细信息的命令。
cluster1::*> network interface check cluster-connectivity show
Source Destination Packet
Node Date LIF LIF Loss
------ -------------------------- ---------------- ---------------- -----------
node1
3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none
3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none
node2
3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none
3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
对于所有ONTAP版本,您也可以使用 `cluster ping-cluster -node <name>`检查连接性的命令:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local
Host is node2
Getting addresses from network interface table...
Cluster node1_clus1 169.254.209.69 node1 e3a
Cluster node1_clus2 169.254.49.125 node1 e3b
Cluster node2_clus1 169.254.47.194 node2 e3a
Cluster node2_clus2 169.254.19.183 node2 e3b
Local = 169.254.47.194 169.254.19.183
Remote = 169.254.209.69 169.254.49.125
Cluster Vserver Id = 4294967293
Ping status:....
Basic connectivity succeeds on 4 path(s)
Basic connectivity fails on 0 path(s)
................
Detected 9000 byte MTU on 4 path(s):
Local 169.254.19.183 to Remote 169.254.209.69
Local 169.254.19.183 to Remote 169.254.49.125
Local 169.254.47.194 to Remote 169.254.209.69
Local 169.254.47.194 to Remote 169.254.49.125
Larger than PMTU communication succeeds on 4 path(s)
RPC status:
2 paths up, 0 paths down (tcp check)
2 paths up, 0 paths down (udp check)
-
在交换机 c2 上,关闭连接到节点集群端口的端口,以便集群 LIF 进行故障转移。
(c2)# configure (c2)(Config)# interface 0/1-0/12 (c2)(Interface 0/1-0/12)# shutdown (c2)(Interface 0/1-0/12)# exit (c2)(Config)# exit (c2)#
-
将节点集群端口从旧交换机 c2 移至新交换机 sw2,使用NVIDIA SN2100 支持的适当线缆。
-
显示网络端口属性:
network port show -ipspace Cluster显示示例
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
从节点的角度来看,每个节点上的集群端口现在按以下方式连接到集群交换机:
network device-discovery show -protocol显示示例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node1 /lldp e3a c1 (6a:ad:4f:98:3b:3f) 0/1 - e3b sw2 (b8:ce:f6:19:1a:7e) swp3 - node2 /lldp e3a c1 (6a:ad:4f:98:3b:3f) 0/2 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 - -
在交换机 sw2 上,确认所有节点集群端口均已启动:
net show interface显示示例
cumulus@sw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
在交换机 c1 上,关闭连接到节点集群端口的端口,以便集群 LIF 进行故障转移。
(c1)# configure (c1)(Config)# interface 0/1-0/12 (c1)(Interface 0/1-0/12)# shutdown (c1)(Interface 0/1-0/12)# exit (c1)(Config)# exit (c1)#
-
将节点集群端口从旧交换机 c1 移至新交换机 sw1,使用NVIDIA SN2100 支持的适当线缆。
-
验证集群的最终配置:
network port show -ipspace Cluster每个端口应显示
up`为了 `Link`和 `healthy`为了 `Health Status。显示示例
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ---------- ---------------- ---- ----- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false -
从节点的角度来看,每个节点上的集群端口现在按以下方式连接到集群交换机:
network device-discovery show -protocol显示示例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- -------------- ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b sw2 (b8:ce:f6:19:1b:96) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 - -
在交换机 sw1 和 sw2 上,验证所有节点集群端口是否都已启动:
net show interface显示示例
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 e3a Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 e3a Master: bridge(UP) UP swp15 100G 9216 BondMember sw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw2 (swp16) Master: cluster_isl(UP) cumulus@sw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ----------------------- ... ... UP swp3 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 e3b Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
确认两个节点都分别与每个交换机建立了一条连接:
net show lldp显示示例
以下示例显示了两种开关的正确结果:
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ------------------ ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember sw2 swp15 swp16 100G BondMember sw2 swp16 cumulus@sw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ------------------ ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
步骤 3:验证配置
-
启用集群 LIF 的自动回滚功能:
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true -
在交换机 sw2 上,关闭并重新启动所有集群端口,以触发所有不在它们所属端口上的集群 LIF 的自动恢复。
cumulus@sw2:mgmt:~$ net add interface swp1-14 link down cumulus@sw2:mgmt:~$ net pending cumulus@sw2:mgmt:~$ net commit (Wait for 5-10 seconds before re-enabling the ports) cumulus@sw2:mgmt:~$ net add interface swp1-14 link up cumulus@sw2:mgmt:~$ net pending cumulus@sw2:mgmt:~$ net commit (After executing the link state up command, the nodes detect the change and begin to auto-revert the cluster LIFs to their home ports)
cumulus@sw2:mgmt:~$ nv set interface swp1-14 link state down cumulus@sw2:mgmt:~$ nv config apply cumulus@sw2:mgmt:~$ nv show interface (Wait for 5-10 seconds before re-enabling the ports) cumulus@sw2:mgmt:~$ nv set interface swp1-14 link state up cumulus@sw2:mgmt:~$ nv config apply cumulus@sw2:mgmt:~$ nv show interface (After executing the link state up command, the nodes detect the change and begin to auto-revert the cluster LIFs to their home ports)
-
验证集群 LIF 是否已恢复到其原端口(这可能需要一分钟):
network interface show -vserver Cluster如果集群中的任何 LIF 尚未恢复到其主端口,请手动将其恢复。您必须连接到拥有该 LIF 的本地节点的每个节点管理 LIF 或SP/ BMC系统控制台:
network interface revert -vserver Cluster -lif * -
将权限级别改回管理员:
set -privilege admin -
如果您已禁用自动创建案例功能,请通过调用AutoSupport消息重新启用该功能:
system node autosupport invoke -node * -type all -message MAINT=END
交换机迁移完成后,您可以…… "配置交换机健康监控"。