迁移到使用NVIDIA SN2100集群交换机的双节点交换集群
如果您有一个现有的双节点无交换机集群环境、则可以使用NVIDIA SN2100交换机迁移到双节点有交换机集群环境、以便可以扩展到集群中的两个节点以上。
您使用的操作步骤取决于每个控制器上是有两个专用集群网络端口,还是每个控制器上有一个集群端口。记录的过程适用于使用光纤或双轴端口的所有节点、但如果节点使用板载10GBASE-T RJ45端口作为集群网络端口、则此交换机不支持此过程。
查看要求
对于双节点无交换机配置、请确保:
-
双节点无交换机配置已正确设置并正常运行。
-
这些节点运行的是ONTAP 9.10.1P3及更高版本。
-
所有集群端口均处于启动状态。
-
所有集群逻辑接口(LIF)均处于up状态并位于其主端口上。
对于NVIDIA SN2100集群交换机配置、请确保:
-
这两台交换机都具有管理网络连接。
-
可以通过控制台访问集群交换机。
-
NVIDIA SN2100节点到节点交换机和交换机到交换机连接使用双轴电缆或光缆。
请参见 "布线和配置注意事项" 了解注意事项和更多详细信息。 。 "Hardware Universe —交换机" 包含有关布线的详细信息。
-
交换机间链路(ISL)缆线连接到两个NVIDIA SN2100交换机上的端口swp15和swp16。
-
两个SN2100交换机的初始自定义已完成、以便:
-
SN2100交换机正在运行最新版本的Cumulus Linux
-
参考配置文件( Reference Configuration Files , RCF )已应用于交换机
-
新交换机上会配置任何站点自定义、例如SMTP、SNMP和SSH。
-
迁移交换机
此操作步骤中的示例使用以下集群交换机和节点命名:
-
SN2100交换机的名称是_sw1_和_SW2_。
-
集群 SVM 的名称是 node1 和 node2 。
-
LIF 的名称分别是节点 1 上的 node1_clus1 和 node1_clus2 以及节点 2 上的 node2_clus1 和 node2_clus2 。
-
cluster1 ::: * >
提示符指示集群的名称。 -
此操作步骤 中使用的集群端口为_e3A_和_e3b_。
-
分支端口采用以下格式:swp[port]s[分支端口0-3]。例如、swp1上的四个分支端口为_swp1s0_、swp1s1、swp1s2_和_swp1s3。
。 "Hardware Universe" 包含有关平台的实际集群端口的最新信息。
第1步:准备迁移
-
如果在此集群上启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例:
ssystem node AutoSupport invoke -node * -type all -message MAINT=xh
其中 x 是维护时段的持续时间,以小时为单位。
-
将权限级别更改为高级,在系统提示您继续时输入
y
:set -privilege advanced
此时将显示高级提示符(` * >` )。
第2步:配置缆线和端口
-
在新集群交换机sw1和SW2上禁用所有面向节点的端口(而不是ISL端口)。
不得禁用 ISL 端口。
显示示例
以下命令可禁用交换机sw1和SW2上面向节点的端口:
cumulus@sw1:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit cumulus@sw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw2:~$ net pending cumulus@sw2:~$ net commit
-
验证端口swp15和swp16上的ISL和两个SN2100交换机sw1和SW2之间的ISL上的物理端口是否已启动:
net show interface
显示示例
以下示例显示交换机sw1上的ISL端口已启动:
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- ----------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw2 (swp16) Master: cluster_isl(UP)
+以下示例显示交换机SW2上的ISL端口已启动:
+
cumulus@sw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- ----------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
验证所有集群端口是否均已启动:
network port show
对于
Link
,每个端口均应显示 up ;对于Health Status
,每个端口均应显示 Healthy 。显示示例
cluster1::*> network port show Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false
-
验证所有集群 LIF 是否均已启动且正常运行:
network interface show
对于
,每个集群 LIF 均应显示 true ,表示为 Home
,并将S状态管理 /Oper
设置为 up/up显示示例
cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ----- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true
-
在集群LIF上禁用自动还原:
network interface modify -vserver cluster -lif *-auto-revert false
显示示例
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false Logical Vserver Interface Auto-revert --------- ------------- ------------ Cluster node1_clus1 false node1_clus2 false node2_clus1 false node2_clus2 false
-
从节点1上的集群端口E3A断开缆线连接、然后使用SN2100交换机支持的相应布线方式将E3A连接到集群交换机sw1上的端口3。
。 "Hardware Universe —交换机" 包含有关布线的详细信息。
-
从节点2上的集群端口E3A断开缆线连接、然后使用SN2100交换机支持的相应布线方式将E3A连接到集群交换机sw1上的端口4。
-
在交换机sw1上、启用所有面向节点的端口。
显示示例
以下命令将启用交换机sw1上面向节点的所有端口:
cumulus@sw1:~$ net del interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit
-
在交换机sw1上、验证所有端口是否均已启动:
net show interface all
显示示例
cumulus@sw1:~$ net show interface all State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- --------------- -------- ... DN swp1s0 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s1 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s2 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s3 10G 9216 Trunk/L2 Master: br_default(UP) DN swp2s0 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s1 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s2 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s3 25G 9216 Trunk/L2 Master: br_default(UP) UP swp3 100G 9216 Trunk/L2 node1 (e3a) Master: br_default(UP) UP swp4 100G 9216 Trunk/L2 node2 (e3a) Master: br_default(UP) ... ... UP swp15 100G 9216 BondMember swp15 Master: cluster_isl(UP) UP swp16 100G 9216 BondMember swp16 Master: cluster_isl(UP) ...
-
验证所有集群端口是否均已启动:
network port show -ipspace cluster
显示示例
以下示例显示 node1 和 node2 上的所有集群端口均已启动:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false
-
显示有关集群中节点状态的信息:
cluster show
显示示例
以下示例显示了有关集群中节点的运行状况和资格的信息:
cluster1::*> cluster show Node Health Eligibility Epsilon -------------------- ------- ------------ ------------ node1 true true false node2 true true false
-
断开缆线与node1上的集群端口e3b的连接、然后使用SN2100交换机支持的相应布线方式将e3b连接到集群交换机SW2上的端口3。
-
断开缆线与node2上的集群端口e3b的连接、然后使用SN2100交换机支持的相应布线方式将e3b连接到集群交换机SW2上的端口4。
-
在交换机SW2上、启用所有面向节点的端口。
显示示例
以下命令可在交换机SW2上启用面向节点的端口:
cumulus@sw2:~$ net del interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@sw2:~$ net pending cumulus@sw2:~$ net commit
-
在交换机SW2上、验证所有端口是否均已启动:
net show interface all
显示示例
cumulus@sw2:~$ net show interface all State Name Spd MTU Mode LLDP Summary ----- --------- ---- ----- ---------- --------------- -------- ... DN swp1s0 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s1 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s2 10G 9216 Trunk/L2 Master: br_default(UP) DN swp1s3 10G 9216 Trunk/L2 Master: br_default(UP) DN swp2s0 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s1 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s2 25G 9216 Trunk/L2 Master: br_default(UP) DN swp2s3 25G 9216 Trunk/L2 Master: br_default(UP) UP swp3 100G 9216 Trunk/L2 node1 (e3b) Master: br_default(UP) UP swp4 100G 9216 Trunk/L2 node2 (e3b) Master: br_default(UP) ... ... UP swp15 100G 9216 BondMember swp15 Master: cluster_isl(UP) UP swp16 100G 9216 BondMember swp16 Master: cluster_isl(UP) ...
-
在两个交换机sw1和SW2上、验证两个节点与每个交换机都有一个连接:
net show lldp
显示示例
以下示例显示了交换机sw1和SW2的相应结果:
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember sw2 swp15 swp16 100G BondMember sw2 swp16 cumulus@sw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
第3步:完成操作步骤
-
显示有关集群中发现的网络设备的信息:
net device-discovery show -protocol lldp
显示示例
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ------------ ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b sw2 (b8:ce:f6:19:1b:96) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 -
-
验证所有集群端口是否均已启动:
network port show -ipspace cluster
显示示例
以下示例显示 node1 和 node2 上的所有集群端口均已启动:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false
-
在所有集群LIF上启用自动还原:
net interface modify -vserver Cluster -lif * -auto-revert true
显示示例
cluster1::*> net interface modify -vserver Cluster -lif * -auto-revert true Logical Vserver Interface Auto-revert --------- ------------- ------------ Cluster node1_clus1 true node1_clus2 true node2_clus1 true node2_clus2 true
-
验证
Is Home
的所有接口是否均显示 true :net interface show -vserver Cluster
此操作可能需要一分钟才能完成。 显示示例
以下示例显示 node1 和 node2 上的所有 LIF 均已启动,并且
为 Home
结果为 true :cluster1::*> net interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home --------- ------------ ---------- ------------------ ---------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true
-
验证这些设置是否已禁用:
network options switchless-cluster show
显示示例
以下示例中的 false 输出显示配置设置已禁用:
cluster1::*> network options switchless-cluster show Enable Switchless Cluster: false
-
验证集群中节点成员的状态:
cluster show
显示示例
以下示例显示了有关集群中节点的运行状况和资格的信息:
cluster1::*> cluster show Node Health Eligibility Epsilon -------------------- ------- ------------ -------- node1 true true false node2 true true false
-
确保集群网络具有完全连接:
cluster ping-cluster -node node-name
显示示例
cluster1::*> cluster ping-cluster -node node1 Host is node1 Getting addresses from network interface table... Cluster node1_clus1 169.254.209.69 node1 e3a Cluster node1_clus2 169.254.49.125 node1 e3b Cluster node2_clus1 169.254.47.194 node2 e3a Cluster node2_clus2 169.254.19.183 node2 e3b Local = 169.254.47.194 169.254.19.183 Remote = 169.254.209.69 169.254.49.125 Cluster Vserver Id = 4294967293 Ping status: Basic connectivity succeeds on 4 path(s) Basic connectivity fails on 0 path(s) Detected 9000 byte MTU on 4 path(s): Local 169.254.47.194 to Remote 169.254.209.69 Local 169.254.47.194 to Remote 169.254.49.125 Local 169.254.19.183 to Remote 169.254.209.69 Local 169.254.19.183 to Remote 169.254.49.125 Larger than PMTU communication succeeds on 4 path(s) RPC status: 2 paths up, 0 paths down (tcp check) 2 paths up, 0 paths down (udp check)
-
使用以下命令启用以太网交换机运行状况监控器日志收集功能,以收集交换机相关的日志文件:
ssystem switch Ethernet log setup-password`和`ssystem switch Ethernet log enable-Collection
输入:
ssystem switch Ethernet log setup-password
显示示例
cluster1::*> system switch ethernet log setup-password Enter the switch name: <return> The switch name entered is not recognized. Choose from the following list: sw1 sw2 cluster1::*> system switch ethernet log setup-password Enter the switch name: sw1 RSA key fingerprint is e5:8b:c6:dc:e2:18:18:09:36:63:d9:63:dd:03:d9:cc Do you want to continue? {y|n}::[n] y Enter the password: <enter switch password> Enter the password again: <enter switch password> cluster1::*> system switch ethernet log setup-password Enter the switch name: sw2 RSA key fingerprint is 57:49:86:a1:b9:80:6a:61:9a:86:8e:3c:e3:b7:1f:b1 Do you want to continue? {y|n}:: [n] y Enter the password: <enter switch password> Enter the password again: <enter switch password>
后跟:
s系统交换机以太网日志 enable-Collection
显示示例
cluster1::*> system switch ethernet log enable-collection Do you want to enable cluster log collection for all nodes in the cluster? {y|n}: [n] y Enabling cluster switch log collection. cluster1::*>
如果其中任何一个命令返回错误,请联系 NetApp 支持部门。 -
启动交换机日志收集功能:
system switch ethernet log collect -device *
等待10分钟、然后使用命令检查日志收集是否成功:
system switch ethernet log show
显示示例
cluster1::*> system switch ethernet log show Log Collection Enabled: true Index Switch Log Timestamp Status ------ ---------------------------- ------------------- --------- 1 sw1 (b8:ce:f6:19:1b:42) 4/29/2022 03:05:25 complete 2 sw2 (b8:ce:f6:19:1b:96) 4/29/2022 03:07:42 complete
-
将权限级别重新更改为 admin :
set -privilege admin
-
如果禁止自动创建案例,请通过调用 AutoSupport 消息重新启用它:
ssystem node AutoSupport invoke -node * -type all -message MAINT=end