更换 Cisco Nexus 9336C-x2 集群交换机
按照以下步骤更换集群网络中有故障的Nexus 9336C-x2交换机。这是无中断操作步骤 (NDU)。
查看要求
在执行交换机更换之前、请确保:
-
您已验证交换机序列号、以确保更换了正确的交换机。
-
在现有集群和网络基础架构上:
-
现有集群已通过验证可完全正常运行、并且至少有一个完全连接的集群交换机。
-
所有集群端口均为*启动*。
-
所有集群逻辑接口(LIF)均为*启动*并位于其主端口上。
-
ONTAP `cluster ping-cluster -node node1`命令必须指示所有路径上的基本连接以及大于PMTU的通信均成功。
-
-
在Nexus 9336C-FX2更换交换机上:
-
替代交换机上的管理网络连接正常工作。
-
可以通过控制台访问替代交换机。
-
节点连接为端口 1/1 到 1/34 :
-
端口1/35和1/36上的所有交换机间链路(ISL)端口均已禁用。
-
所需的参考配置文件(Reference Configuration File、RCF)和NX-OS操作系统映像交换机将加载到此交换机上。
-
交换机的初始自定义已完成、如中所述 "配置9336C-x2集群交换机"。
先前的所有站点自定义设置(例如STP、SNMP和SSH)都会复制到新交换机。
-
-
您已执行命令从托管集群LIF的节点迁移集群LIF。
启用控制台日志记录
NetApp强烈建议您在使用的设备上启用控制台日志记录、并在更换交换机时采取以下措施:
-
在维护期间保持AutoSupport处于启用状态。
-
在维护前后触发维护AutoSupport、以便在维护期间禁用案例创建。请参见此知识库文章 "SU92:如何禁止在计划维护时段自动创建案例" 了解更多详细信息。
-
为所有命令行界面会话启用会话日志记录。有关如何启用会话日志记录的说明、请查看此知识库文章中的"记录会话输出"一节 "如何配置PuTTY以优化与ONTAP系统的连接"。
更换交换机
此操作步骤中的示例使用以下交换机和节点命名:
-
现有 Nexus 9336C-FX2 交换机的名称是 CS1 和 CS2 。
-
新 Nexus 9336C-x2 交换机的名称是 newcs2 。
-
节点名称为 node1 和 node2 。
-
每个节点上的集群端口均名为 e0a 和 e0b 。
-
集群 LIF 名称分别为 node1 和 node1_clus1 和 node1_clus2 , node2 和 node2_clus1 和 node2_clus2 。
-
对所有集群节点进行更改的提示为 cluster1 ::: * > 。
以下操作步骤基于以下集群网络拓扑:
显示示例
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false 4 entries were displayed. cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e0a true node1_clus2 up/up 169.254.49.125/16 node1 e0b true node2_clus1 up/up 169.254.47.194/16 node2 e0a true node2_clus2 up/up 169.254.19.183/16 node2 e0b true 4 entries were displayed. cluster1::*> network device-discovery show -protocol cdp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node2 /cdp e0a cs1 Eth1/2 N9K-C9336C e0b cs2 Eth1/2 N9K-C9336C node1 /cdp e0a cs1 Eth1/1 N9K-C9336C e0b cs2 Eth1/1 N9K-C9336C 4 entries were displayed. cs1# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 144 H FAS2980 e0a node2 Eth1/2 145 H FAS2980 e0a cs2 Eth1/35 176 R S I s N9K-C9336C Eth1/35 cs2(FDO220329V5) Eth1/36 176 R S I s N9K-C9336C Eth1/36 Total entries displayed: 4 cs2# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 139 H FAS2980 e0b node2 Eth1/2 124 H FAS2980 e0b cs1 Eth1/35 178 R S I s N9K-C9336C Eth1/35 cs1 Eth1/36 178 R S I s N9K-C9336C Eth1/36 Total entries displayed: 4
第1步:准备更换
-
如果在此集群上启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例:
ssystem node AutoSupport invoke -node * -type all -message MAINT=xh
其中 x 是维护时段的持续时间,以小时为单位。
AutoSupport 消息会通知技术支持此维护任务,以便在维护窗口期间禁止自动创建案例。 -
在交换机 newcs2 上安装相应的 RCF 和映像,并进行必要的站点准备。
如有必要,请验证,下载并安装适用于新交换机的 RCF 和 NX-OS 软件的相应版本。如果您已确认新交换机设置正确,并且不需要更新 RCF 和 NX-OS 软件,请继续执行步骤 2 。
-
转至 NetApp 支持站点上的 NetApp 集群和管理网络交换机参考配置文件问题描述 Page 。
-
单击 _Cluster Network and Management Network Compatibility Matrix _ 的链接,然后记下所需的交换机软件版本。
-
单击浏览器的后退箭头返回到问题描述页面,单击 * 继续 * ,接受许可协议,然后转到下载页面。
-
按照下载页面上的步骤下载与您要安装的 ONTAP 软件版本对应的正确 RCF 和 NX-OS 文件。
-
-
在新交换机上,以 admin 身份登录并关闭将连接到节点集群接口的所有端口(端口 1/1 到 1/34 )。
如果要更换的交换机无法正常工作并已关闭电源,请转至步骤 4 。集群节点上的 LIF 应已故障转移到每个节点的另一个集群端口。
显示示例
newcs2# config Enter configuration commands, one per line. End with CNTL/Z. newcs2(config)# interface e1/1-34 newcs2(config-if-range)# shutdown
-
验证所有集群 LIF 是否均已启用自动还原:
network interface show - vserver cluster -fields auto-revert
显示示例
cluster1::> network interface show -vserver Cluster -fields auto-revert Logical Vserver Interface Auto-revert ------------ ------------- ------------- Cluster node1_clus1 true Cluster node1_clus2 true Cluster node2_clus1 true Cluster node2_clus2 true 4 entries were displayed.
-
验证远程集群接口的连接:
您可以使用 network interface check cluster-connectivity
命令启动集群连接的可访问性检查、然后显示详细信息:
network interface check cluster-connectivity start
和 network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
*注:*请等待几秒钟、然后再运行 `show`命令以显示详细信息。
cluster1::*> network interface check cluster-connectivity show Source Destination Packet Node Date LIF LIF Loss ------ -------------------------- ---------------- ---------------- ----------- node1 3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none 3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none node2 3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none 3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
对于所有ONTAP版本、您还可以使用 cluster ping-cluster -node <name>
用于检查连接的命令:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local Host is node2 Getting addresses from network interface table... Cluster node1_clus1 169.254.209.69 node1 e0a Cluster node1_clus2 169.254.49.125 node1 e0b Cluster node2_clus1 169.254.47.194 node2 e0a Cluster node2_clus2 169.254.19.183 node2 e0b Local = 169.254.47.194 169.254.19.183 Remote = 169.254.209.69 169.254.49.125 Cluster Vserver Id = 4294967293 Ping status: .... Basic connectivity succeeds on 4 path(s) Basic connectivity fails on 0 path(s) ................ Detected 9000 byte MTU on 4 path(s): Local 169.254.47.194 to Remote 169.254.209.69 Local 169.254.47.194 to Remote 169.254.49.125 Local 169.254.19.183 to Remote 169.254.209.69 Local 169.254.19.183 to Remote 169.254.49.125 Larger than PMTU communication succeeds on 4 path(s) RPC status: 2 paths up, 0 paths down (tcp check) 2 paths up, 0 paths down (udp check)
第2步:配置缆线和端口
-
关闭Nexus 9336C-FX2交换机CS1上的ISL端口1/35和1/36。
显示示例
cs1# configure Enter configuration commands, one per line. End with CNTL/Z. cs1(config)# interface e1/35-36 cs1(config-if-range)# shutdown cs1(config-if-range)#
-
拔下 Nexus 9336C-x2 CS2 交换机上的所有缆线,然后将其连接到 Nexus C9336C-x2 newcs2 交换机上的相同端口。
-
启动 CS1 和 newcs2 交换机之间的 ISL 端口 1/35 和 1/36 ,然后验证端口通道操作状态。
端口通道应指示 PO1 ( SU ),成员端口应指示 Eth1/35 ( P )和 Eth1/36 ( P )。
显示示例
此示例将启用 ISL 端口 1/35 和 1/36 ,并显示交换机 CS1 上的端口通道摘要:
cs1# configure Enter configuration commands, one per line. End with CNTL/Z. cs1(config)# int e1/35-36 cs1(config-if-range)# no shutdown cs1(config-if-range)# show port-channel summary Flags: D - Down P - Up in port-channel (members) I - Individual H - Hot-standby (LACP only) s - Suspended r - Module-removed b - BFD Session Wait S - Switched R - Routed U - Up (port-channel) p - Up in delay-lacp mode (member) M - Not in use. Min-links not met -------------------------------------------------------------------------------- Group Port- Type Protocol Member Ports Channel -------------------------------------------------------------------------------- 1 Po1(SU) Eth LACP Eth1/35(P) Eth1/36(P) cs1(config-if-range)#
-
验证所有节点上的端口 e0b 是否均已启动:
network port show -ipspace cluster
显示示例
输出应类似于以下内容:
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- -------- ------- e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- -------- ------- e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/auto - false 4 entries were displayed.
-
在上一步中使用的同一节点上,使用 network interface revert 命令还原与上一步中的端口关联的集群 LIF 。
显示示例
在此示例中,如果 Home 值为 true 且端口为 e0b ,则 node1 上的 LIF node1_clus2 将成功还原。
以下命令会将 LIF
node1_clus2
onnode1
返回到主端口e0a
,并显示有关两个节点上的 LIF 的信息。如果两个集群接口的 is Home 列均为 true 且显示正确的端口分配,则启动第一个节点将成功,此示例中为 node1 上的e0a
和e0b
。cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ------------ ---------- ------------------ ---------- ------- ----- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e0a true node1_clus2 up/up 169.254.49.125/16 node1 e0b true node2_clus1 up/up 169.254.47.194/16 node2 e0a true node2_clus2 up/up 169.254.19.183/16 node2 e0a false 4 entries were displayed.
-
显示有关集群中节点的信息:
cluster show
显示示例
此示例显示此集群中 node1 和 node2 的节点运行状况为 true :
cluster1::*> cluster show Node Health Eligibility ------------- ------- ------------ node1 false true node2 true true
-
验证所有物理集群端口是否均已启动:
network port show -ipspace cluster
显示示例
cluster1::*> network port show -ipspace Cluster Node node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ----------------- ----- ----- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ----- ----- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false 4 entries were displayed.
-
验证远程集群接口的连接:
您可以使用 network interface check cluster-connectivity
命令启动集群连接的可访问性检查、然后显示详细信息:
network interface check cluster-connectivity start
和 network interface check cluster-connectivity show
cluster1::*> network interface check cluster-connectivity start
*注:*请等待几秒钟、然后再运行 `show`命令以显示详细信息。
cluster1::*> network interface check cluster-connectivity show Source Destination Packet Node Date LIF LIF Loss ------ -------------------------- ---------------- ---------------- ----------- node1 3/5/2022 19:21:18 -06:00 node1_clus2 node2-clus1 none 3/5/2022 19:21:20 -06:00 node1_clus2 node2_clus2 none node2 3/5/2022 19:21:18 -06:00 node2_clus2 node1_clus1 none 3/5/2022 19:21:20 -06:00 node2_clus2 node1_clus2 none
对于所有ONTAP版本、您还可以使用 cluster ping-cluster -node <name>
用于检查连接的命令:
cluster ping-cluster -node <name>
cluster1::*> cluster ping-cluster -node local Host is node2 Getting addresses from network interface table... Cluster node1_clus1 169.254.209.69 node1 e0a Cluster node1_clus2 169.254.49.125 node1 e0b Cluster node2_clus1 169.254.47.194 node2 e0a Cluster node2_clus2 169.254.19.183 node2 e0b Local = 169.254.47.194 169.254.19.183 Remote = 169.254.209.69 169.254.49.125 Cluster Vserver Id = 4294967293 Ping status: .... Basic connectivity succeeds on 4 path(s) Basic connectivity fails on 0 path(s) ................ Detected 9000 byte MTU on 4 path(s): Local 169.254.47.194 to Remote 169.254.209.69 Local 169.254.47.194 to Remote 169.254.49.125 Local 169.254.19.183 to Remote 169.254.209.69 Local 169.254.19.183 to Remote 169.254.49.125 Larger than PMTU communication succeeds on 4 path(s) RPC status: 2 paths up, 0 paths down (tcp check) 2 paths up, 0 paths down (udp check)
第3步:验证配置
-
确认以下集群网络配置:
network port show
显示示例
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ---------------- ---- ----- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ----------- -------- ------ e0a Cluster Cluster up 9000 auto/10000 healthy false e0b Cluster Cluster up 9000 auto/10000 healthy false 4 entries were displayed. cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e0a true node1_clus2 up/up 169.254.49.125/16 node1 e0b true node2_clus1 up/up 169.254.47.194/16 node2 e0a true node2_clus2 up/up 169.254.19.183/16 node2 e0b true 4 entries were displayed. cluster1::> network device-discovery show -protocol cdp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ---------------- ---------------- node2 /cdp e0a cs1 0/2 N9K-C9336C e0b newcs2 0/2 N9K-C9336C node1 /cdp e0a cs1 0/1 N9K-C9336C e0b newcs2 0/1 N9K-C9336C 4 entries were displayed. cs1# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 144 H FAS2980 e0a node2 Eth1/2 145 H FAS2980 e0a newcs2 Eth1/35 176 R S I s N9K-C9336C Eth1/35 newcs2 Eth1/36 176 R S I s N9K-C9336C Eth1/36 Total entries displayed: 4 cs2# show cdp neighbors Capability Codes: R - Router, T - Trans-Bridge, B - Source-Route-Bridge S - Switch, H - Host, I - IGMP, r - Repeater, V - VoIP-Phone, D - Remotely-Managed-Device, s - Supports-STP-Dispute Device-ID Local Intrfce Hldtme Capability Platform Port ID node1 Eth1/1 139 H FAS2980 e0b node2 Eth1/2 124 H FAS2980 e0b cs1 Eth1/35 178 R S I s N9K-C9336C Eth1/35 cs1 Eth1/36 178 R S I s N9K-C9336C Eth1/36 Total entries displayed: 4
-
如果禁止自动创建案例,请通过调用 AutoSupport 消息重新启用它:
ssystem node AutoSupport invoke -node * -type all -message MAINT=end
"配置交换机运行状况监控"(英文)