迁移到使用NVIDIA SN2100集群交换机的双节点交换集群
如果您有一个现有的双节点无交换机集群环境、则可以使用NVIDIA SN2100交换机迁移到双节点有交换机集群环境、以便可以扩展到集群中的两个节点以上。
您使用的操作步骤取决于每个控制器上是有两个专用集群网络端口,还是每个控制器上有一个集群端口。记录的过程适用于使用光纤或双轴端口的所有节点、但如果节点将板载10GBASE-T RJ45端口用于集群网络端口、则此交换机不支持此过程。
查看要求
确保:
-
双节点无交换机配置已正确设置并正常运行。
-
这些节点运行的是ONTAP 9.10.1P3及更高版本。
-
所有集群端口均处于*启动*状态。
-
所有集群逻辑接口(LIF)均处于*启动*状态、并位于其主端口上。
确保:
-
这两台交换机都具有管理网络连接。
-
可以通过控制台访问集群交换机。
-
NVIDIA SN2100节点到节点交换机和交换机到交换机连接使用双轴电缆或光缆。
请参见 "查看布线和配置注意事项" 了解注意事项和更多详细信息。。 "Hardware Universe —交换机" 还包含有关布线的详细信息。 -
交换机间链路(ISL)缆线连接到两个NVIDIA SN2100交换机上的端口swp15和swp16。
-
两个SN2100交换机的初始自定义已完成、以便:
-
SN2100交换机正在运行最新版本的Cumulus Linux
-
参考配置文件(Reference Configuration Files、RCF)将应用于交换机
-
新交换机上会配置任何站点自定义、例如SMTP、SNMP和SSH。
。 "Hardware Universe" 包含有关平台的实际集群端口的最新信息。
-
迁移交换机
此操作步骤中的示例使用以下集群交换机和节点命名:
-
SN2100交换机的名称是_sw1_和_SW2_。
-
集群 SVM 的名称是 node1 和 node2 。
-
LIF 的名称分别是节点 1 上的 node1_clus1 和 node1_clus2 以及节点 2 上的 node2_clus1 和 node2_clus2 。
-
cluster1 ::: * >
提示符指示集群的名称。 -
此操作步骤 中使用的集群端口为_e3A_和_e3b_。
-
分支端口采用以下格式:swp[port]s[分支端口0-3]。例如、swp1上的四个分支端口为_swp1s0_、swp1s1、swp1s2_和_swp1s3。
第1步:准备迁移
-
如果在此集群上启用了 AutoSupport ,请通过调用 AutoSupport 消息来禁止自动创建案例:
ssystem node AutoSupport invoke -node * -type all -message MAINT=xh
其中 x 是维护时段的持续时间,以小时为单位。
-
将权限级别更改为高级,在系统提示您继续时输入
y
:set -privilege advanced
此时将显示高级提示符(` * >` )。
第2步:配置端口和布线
-
在新集群交换机sw1和SW2上禁用所有面向节点的端口(而不是ISL端口)。
不得禁用 ISL 端口。
以下命令可禁用交换机sw1和SW2上面向节点的端口:
cumulus@sw1:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit cumulus@sw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw2:~$ net pending cumulus@sw2:~$ net commit
-
验证端口swp15和swp16上的ISL和两个SN2100交换机sw1和SW2之间的ISL上的物理端口是否已启动:
net show interface
以下命令显示交换机sw1和sw2上的ISL端口已启动:
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- ----------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw2 (swp16) Master: cluster_isl(UP) cumulus@sw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- ----------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
禁用新集群交换机sw1和sw2上所有面向节点的端口(而不是ISL端口)。
不得禁用 ISL 端口。
以下命令可禁用交换机sw1和SW2上面向节点的端口:
cumulus@sw1:~$ nv set interface swp1s0-3,swp2s0-3,swp3-14 link state down cumulus@sw1:~$ nv config apply cumulus@sw1:~$ nv save cumulus@sw2:~$ nv set interface swp1s0-3,swp2s0-3,swp3-14 link state down cumulus@sw2:~$ nv config apply cumulus@sw2:~$ nv save
-
验证端口swp15和swp16上的ISL和两个SN2100交换机sw1和SW2之间的ISL上的物理端口是否已启动:
nv show interface
以下示例显示交换机sw1和sw2上的ISL端口已启动:
cumulus@sw1:~$ nv show interface Interface MTU Speed State Remote Host Remote Port Type Summary ------------- ------ ----- ------ ------------ ------------------------------------ ------- ------- ... ... + swp14 9216 down swp + swp15 9216 100G up ossg-rcf1 Intra-Cluster Switch ISL Port swp15 swp + swp16 9216 100G up ossg-rcf2 Intra-Cluster Switch ISL Port swp16 swp cumulus@sw2:~$ nv show interface Interface MTU Speed State Remote Host Remote Port Type Summary ------------- ------ ----- ------ ------------ ------------------------------------ ------- ------- ... ... + swp14 9216 down swp + swp15 9216 100G up ossg-rcf1 Intra-Cluster Switch ISL Port swp15 swp + swp16 9216 100G up ossg-rcf2 Intra-Cluster Switch ISL Port swp16 swp
-
network port show
应显示每个端口
up
适用于Link
运行状况良好Health Status
。显示示例
cluster1::*> network port show Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false
-
验证所有集群 LIF 是否均已启动且正常运行:
network interface show
对于、每个集群LIF都应显示true
Is Home
并具有Status Admin/Oper
的up/up
。显示示例
cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ----- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true
-
在集群LIF上禁用自动还原:
network interface modify -vserver cluster -lif *-auto-revert false
显示示例
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false Logical Vserver Interface Auto-revert --------- ------------- ------------ Cluster node1_clus1 false node1_clus2 false node2_clus1 false node2_clus2 false
-
从节点1上的集群端口E3A断开缆线连接、然后使用SN2100交换机支持的相应布线方式将E3A连接到集群交换机sw1上的端口3。
。 "Hardware Universe —交换机" 包含有关布线的详细信息。
-
从节点2上的集群端口E3A断开缆线连接、然后使用SN2100交换机支持的相应布线方式将E3A连接到集群交换机sw1上的端口4。
-
以下命令将启用交换机sw1上所有面向节点的端口。
cumulus@sw1:~$ net del interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit
-
[[step ]]在交换机sw1上、验证所有端口是否均已启动:
net show interface all
cumulus@sw1:~$ net show interface all State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- --------------- -------- ... DN swp1s0 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s1 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s2 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s3 10G 9216 Trunk/L2 Master: br_default(UP) DN swp2s0 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s1 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s2 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s3 25G 9216 Trunk/L2 Master: br_default(UP) UP swp3 100G 9216 Trunk/L2 node1 (e3a) Master: br_default(UP) UP swp4 100G 9216 Trunk/L2 node2 (e3a) Master: br_default(UP) ... ... UP swp15 100G 9216 BondMember swp15 Master: cluster_isl(UP) UP swp16 100G 9216 BondMember swp16 Master: cluster_isl(UP) ...
-
以下命令将启用交换机sw1上所有面向节点的端口。
cumulus@sw1:~$ nv set interface swp1s0-3,swp2s0-3,swp3-14 link state up cumulus@sw1:~$ nv config apply cumulus@sw1:~$ nv config save
-
nv show interface
cumulus@sw1:~$ nv show interface Interface State Speed MTU Type Remote Host Remote Port Summary ----------- ----- ----- ----- -------- -------------------------- ----------- ---------- ... ... swp1s0 up 10G 9216 swp odq-a300-1a e0a swp1s1 up 10G 9216 swp odq-a300-1b e0a swp1s2 down 10G 9216 swp swp1s3 down 10G 9216 swp swp2s0 down 25G 9216 swp swp2s1 down 25G 9216 swp swp2s2 down 25G 9216 swp swp2s3 down 25G 9216 swp swp3 down 9216 swp swp4 down 9216 swp ... ... swp14 down 9216 swp swp15 up 100G 9216 swp ossg-int-rcf10 swp15 swp16 up 100G 9216 swp ossg-int-rcf10 swp16
-
network port show -ipspace cluster
显示示例
以下示例显示 node1 和 node2 上的所有集群端口均已启动:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false
-
显示有关集群中节点状态的信息:
cluster show
显示示例
以下示例显示了有关集群中节点的运行状况和资格的信息:
cluster1::*> cluster show Node Health Eligibility Epsilon -------------------- ------- ------------ ------------ node1 true true false node2 true true false
-
断开缆线与node1上的集群端口e3b的连接、然后使用SN2100交换机支持的相应布线方式将e3b连接到集群交换机SW2上的端口3。
-
断开缆线与node2上的集群端口e3b的连接、然后使用SN2100交换机支持的相应布线方式将e3b连接到集群交换机SW2上的端口4。
-
以下命令可在交换机SW2上启用面向节点的端口:
cumulus@sw2:~$ net del interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw2:~$ net pending cumulus@sw2:~$ net commit
-
net show interface all
cumulus@sw2:~$ net show interface all State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- --------------- -------- ... DN swp1s0 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s1 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s2 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s3 10G 9216 Trunk/L2 Master: br_default(UP) DN swp2s0 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s1 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s2 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s3 25G 9216 Trunk/L2 Master: br_default(UP) UP swp3 100G 9216 Trunk/L2 node1 (e3b) Master: br_default(UP) UP swp4 100G 9216 Trunk/L2 node2 (e3b) Master: br_default(UP) ... ... UP swp15 100G 9216 BondMember swp15 Master: cluster_isl(UP) UP swp16 100G 9216 BondMember swp16 Master: cluster_isl(UP) ...
-
在交换机sw1和sw2上、验证两个节点是否都与每个交换机建立了一个连接:
net show lldp
以下示例显示了交换机sw1和SW2的相应结果:
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember sw2 swp15 swp16 100G BondMember sw2 swp16 cumulus@sw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
-
以下命令可在交换机SW2上启用面向节点的端口:
cumulus@sw2:~$ nv set interface swp1s0-3,swp2s0-3,swp3-14 link state up cumulus@sw2:~$ nv config apply cumulus@sw2:~$ nv config save
-
nv show interface
cumulus@sw2:~$ nv show interface Interface State Speed MTU Type Remote Host Remote Port Summary ----------- ----- ----- ----- -------- -------------------------- ----------- ---------- ... ... swp1s0 up 10G 9216 swp odq-a300-1a e0a swp1s1 up 10G 9216 swp odq-a300-1b e0a swp1s2 down 10G 9216 swp swp1s3 down 10G 9216 swp swp2s0 down 25G 9216 swp swp2s1 down 25G 9216 swp swp2s2 down 25G 9216 swp swp2s3 down 25G 9216 swp swp3 down 9216 swp swp4 down 9216 swp ... ... swp14 down 9216 swp swp15 up 100G 9216 swp ossg-int-rcf10 swp15 swp16 up 100G 9216 swp ossg-int-rcf10 swp16
-
在交换机sw1和sw2上、验证两个节点是否都与每个交换机建立了一个连接:
nv show interface --view=lldp
以下示例显示了交换机sw1和sw2的相应结果:
cumulus@sw1:~$ nv show interface --view=lldp Interface Speed Type Remote Host Remote Port ----------- ----- -------- ---------------------------------- ----------- ... ... swp1s0 10G swp odq-a300-1a e0a swp1s1 10G swp odq-a300-1b e0a swp1s2 10G swp swp1s3 10G swp swp2s0 25G swp swp2s1 25G swp swp2s2 25G swp swp2s3 25G swp swp3 swp swp4 swp ... ... swp14 swp swp15 100G swp ossg-int-rcf10 swp15 swp16 100G swp ossg-int-rcf10 swp16 cumulus@sw2:~$ nv show interface --view=lldp Interface Speed Type Remote Host Remote Port ----------- ----- -------- ---------------------------------- ----------- ... ... swp1s0 10G swp odq-a300-1a e0a swp1s1 10G swp odq-a300-1b e0a swp1s2 10G swp swp1s3 10G swp swp2s0 25G swp swp2s1 25G swp swp2s2 25G swp swp2s3 25G swp swp3 swp swp4 swp ... ... swp14 swp swp15 100G swp ossg-int-rcf10 swp15 swp16 100G swp ossg-int-rcf10 swp16
-
network device-discovery show -protocol lldp
显示示例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ------------ ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b sw2 (b8:ce:f6:19:1b:96) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 -
-
验证所有集群端口是否均已启动:
network port show -ipspace cluster
显示示例
以下示例显示 node1 和 node2 上的所有集群端口均已启动:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false
第3步:验证配置
-
在所有集群LIF上启用自动还原:
net interface modify -vserver Cluster -lif * -auto-revert true
显示示例
cluster1::*> net interface modify -vserver Cluster -lif * -auto-revert true Logical Vserver Interface Auto-revert --------- ------------- ------------ Cluster node1_clus1 true node1_clus2 true node2_clus1 true node2_clus2 true
-
验证所有接口是否显示
true
foris Home
:net interface show -vserver Cluster
此操作可能需要一分钟才能完成。 显示示例
以下示例显示 node1 和 node2 上的所有 LIF 均已启动,并且
为 Home
结果为 true :cluster1::*> net interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home --------- ------------ ---------- ------------------ ---------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true
-
验证这些设置是否已禁用:
network options switchless-cluster show
显示示例
以下示例中的 false 输出显示配置设置已禁用:
cluster1::*> network options switchless-cluster show Enable Switchless Cluster: false
-
验证集群中节点成员的状态:
cluster show
显示示例
以下示例显示了有关集群中节点的运行状况和资格的信息:
cluster1::*> cluster show Node Health Eligibility Epsilon -------------------- ------- ------------ -------- node1 true true false node2 true true false
-
验证远程集群接口的连接:
您可以使用 network interface check cluster-connectivity
命令启动集群连接的可访问性检查、然后显示详细信息:
network interface check cluster-connectivity start
和 network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
*注:*请等待几秒钟、然后再运行 `show`命令以显示详细信息。
cluster1::*> network interface check cluster-connectivity show Source Destination Packet Node Date LIF LIF Loss ------ -------------------------- ---------------- ---------------- ----------- node1 3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none 3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none node2 3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none 3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
对于所有ONTAP版本、您还可以使用 cluster ping-cluster -node <name>
用于检查连接的命令:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local Host is node1 Getting addresses from network interface table... Cluster node1_clus1 169.254.209.69 node1 e3a Cluster node1_clus2 169.254.49.125 node1 e3b Cluster node2_clus1 169.254.47.194 node2 e3a Cluster node2_clus2 169.254.19.183 node2 e3b Local = 169.254.47.194 169.254.19.183 Remote = 169.254.209.69 169.254.49.125 Cluster Vserver Id = 4294967293 Ping status: Basic connectivity succeeds on 4 path(s) Basic connectivity fails on 0 path(s) Detected 9000 byte MTU on 4 path(s): Local 169.254.47.194 to Remote 169.254.209.69 Local 169.254.47.194 to Remote 169.254.49.125 Local 169.254.19.183 to Remote 169.254.209.69 Local 169.254.19.183 to Remote 169.254.49.125 Larger than PMTU communication succeeds on 4 path(s) RPC status: 2 paths up, 0 paths down (tcp check) 2 paths up, 0 paths down (udp check)
"配置交换机运行状况监控"(英文)