Skip to main content
Cluster and storage switches
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

迁移到使用NVIDIA SN2100集群交换机的双节点交换集群

贡献者

如果您有一个现有的双节点无交换机集群环境、则可以使用NVIDIA SN2100交换机迁移到双节点有交换机集群环境、以便可以扩展到集群中的两个节点以上。

您使用的操作步骤取决于每个控制器上是有两个专用集群网络端口,还是每个控制器上有一个集群端口。记录的过程适用于使用光纤或双轴端口的所有节点、但如果节点使用板载10GBASE-T RJ45端口作为集群网络端口、则此交换机不支持此过程。

查看要求

您需要的内容

对于双节点无交换机配置、请确保:

  • 双节点无交换机配置已正确设置并正常运行。

  • 这些节点运行的是ONTAP 9.10.1P3及更高版本。

  • 所有集群端口均处于启动状态。

  • 所有集群逻辑接口(LIF)均处于up状态并位于其主端口上。

对于NVIDIA SN2100集群交换机配置、请确保:

  • 这两台交换机都具有管理网络连接。

  • 可以通过控制台访问集群交换机。

  • NVIDIA SN2100节点到节点交换机和交换机到交换机连接使用双轴电缆或光缆。

    备注 请参见 "布线和配置注意事项" 了解注意事项和更多详细信息。

    "Hardware Universe —交换机" 包含有关布线的详细信息。

  • 交换机间链路(ISL)缆线连接到两个NVIDIA SN2100交换机上的端口swp15和swp16。

  • 两个SN2100交换机的初始自定义已完成、以便:

    • SN2100交换机正在运行最新版本的Cumulus Linux

    • 参考配置文件( Reference Configuration Files , RCF )已应用于交换机

    • 新交换机上会配置任何站点自定义、例如SMTP、SNMP和SSH。

迁移交换机

关于示例

此操作步骤中的示例使用以下集群交换机和节点命名:

  • SN2100交换机的名称是_sw1_和_SW2_。

  • 集群 SVM 的名称是 node1node2

  • LIF 的名称分别是节点 1 上的 node1_clus1node1_clus2 以及节点 2 上的 node2_clus1node2_clus2

  • cluster1 ::: * > 提示符指示集群的名称。

  • 此操作步骤 中使用的集群端口为_e3A_和_e3b_。

  • 分支端口采用以下格式:swp[port]s[分支端口0-3]。例如、swp1上的四个分支端口为_swp1s0_、swp1s1swp1s2_和_swp1s3

    "Hardware Universe" 包含有关平台的实际集群端口的最新信息。

第1步:准备迁移

  1. 如果在此集群上启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例:

    ssystem node AutoSupport invoke -node * -type all -message MAINT=xh

    其中 x 是维护时段的持续时间,以小时为单位。

  2. 将权限级别更改为高级,在系统提示您继续时输入 y

    set -privilege advanced

    此时将显示高级提示符(` * >` )。

第2步:配置缆线和端口

  1. 在新集群交换机sw1和SW2上禁用所有面向节点的端口(而不是ISL端口)。

    不得禁用 ISL 端口。

    显示示例

    以下命令可禁用交换机sw1和SW2上面向节点的端口:

    cumulus@sw1:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit
    
    cumulus@sw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@sw2:~$ net pending
    cumulus@sw2:~$ net commit
  2. 验证端口swp15和swp16上的ISL和两个SN2100交换机sw1和SW2之间的ISL上的物理端口是否已启动:

    net show interface

    显示示例

    以下示例显示交换机sw1上的ISL端口已启动:

    cumulus@sw1:~$ net show interface
    
    State  Name       Spd   MTU    Mode        LLDP         Summary
    -----  ---------  ----  -----  ----------  -----------  -----------------------
    ...
    ...
    UP     swp15      100G  9216   BondMember  sw2 (swp15)  Master: cluster_isl(UP)
    UP     swp16      100G  9216   BondMember  sw2 (swp16)  Master: cluster_isl(UP)

    +以下示例显示交换机SW2上的ISL端口已启动:

    +

    cumulus@sw2:~$ net show interface
    
    State  Name       Spd   MTU    Mode        LLDP         Summary
    -----  ---------  ----  -----  ----------  -----------  -----------------------
    ...
    ...
    UP     swp15      100G  9216   BondMember  sw1 (swp15)  Master: cluster_isl(UP)
    UP     swp16      100G  9216   BondMember  sw1 (swp16)  Master: cluster_isl(UP)
  3. 验证所有集群端口是否均已启动:

    network port show

    对于 Link ,每个端口均应显示 up ;对于 Health Status ,每个端口均应显示 Healthy 。

    显示示例
    cluster1::*> network port show
    
    Node: node1
    
                                                                            Ignore
                                                      Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ---- ------------ -------- ------
    e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false
    
    Node: node2
    
                                                                            Ignore
                                                      Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ---- ------------ -------- ------
    e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false
  4. 验证所有集群 LIF 是否均已启动且正常运行:

    network interface show

    对于 ,每个集群 LIF 均应显示 true ,表示为 Home ,并将 S状态管理 /Oper 设置为 up/up

    显示示例
    cluster1::*> network interface show -vserver Cluster
    
                Logical    Status     Network            Current       Current Is
    Vserver     Interface  Admin/Oper Address/Mask       Node          Port    Home
    ----------- ---------- ---------- ------------------ ------------- ------- -----
    Cluster
                node1_clus1  up/up    169.254.209.69/16  node1         e3a     true
                node1_clus2  up/up    169.254.49.125/16  node1         e3b     true
                node2_clus1  up/up    169.254.47.194/16  node2         e3a     true
                node2_clus2  up/up    169.254.19.183/16  node2         e3b     true
  5. 在集群LIF上禁用自动还原:

    network interface modify -vserver cluster -lif *-auto-revert false

    显示示例
    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false
    
              Logical
    Vserver   Interface     Auto-revert
    --------- ------------- ------------
    Cluster
              node1_clus1   false
              node1_clus2   false
              node2_clus1   false
              node2_clus2   false
  6. 从节点1上的集群端口E3A断开缆线连接、然后使用SN2100交换机支持的相应布线方式将E3A连接到集群交换机sw1上的端口3。

    "Hardware Universe —交换机" 包含有关布线的详细信息。

  7. 从节点2上的集群端口E3A断开缆线连接、然后使用SN2100交换机支持的相应布线方式将E3A连接到集群交换机sw1上的端口4。

  8. 在交换机sw1上、启用所有面向节点的端口。

    显示示例

    以下命令将启用交换机sw1上面向节点的所有端口:

    cumulus@sw1:~$ net del interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit
  9. 在交换机sw1上、验证所有端口是否均已启动:

    net show interface all

    显示示例
    cumulus@sw1:~$ net show interface all
    
    State  Name      Spd   MTU    Mode       LLDP            Summary
    -----  --------- ----  -----  ---------- --------------- --------
    ...
    DN     swp1s0    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp1s1    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp1s2    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp1s3    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s0    25G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s1    25G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s2    25G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s3    25G   9216   Trunk/L2                   Master: br_default(UP)
    UP     swp3      100G  9216   Trunk/L2    node1 (e3a)    Master: br_default(UP)
    UP     swp4      100G  9216   Trunk/L2    node2 (e3a)    Master: br_default(UP)
    ...
    ...
    UP     swp15     100G  9216   BondMember  swp15          Master: cluster_isl(UP)
    UP     swp16     100G  9216   BondMember  swp16          Master: cluster_isl(UP)
    ...
  10. 验证所有集群端口是否均已启动:

    network port show -ipspace cluster

    显示示例

    以下示例显示 node1 和 node2 上的所有集群端口均已启动:

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                            Ignore
                                                      Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ---- ------------ -------- ------
    e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false
    
    Node: node2
                                                                            Ignore
                                                      Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ---- ------------ -------- ------
    e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false
  11. 显示有关集群中节点状态的信息:

    cluster show

    显示示例

    以下示例显示了有关集群中节点的运行状况和资格的信息:

    cluster1::*> cluster show
    
    Node                 Health  Eligibility   Epsilon
    -------------------- ------- ------------  ------------
    node1                true    true          false
    node2                true    true          false
  12. 断开缆线与node1上的集群端口e3b的连接、然后使用SN2100交换机支持的相应布线方式将e3b连接到集群交换机SW2上的端口3。

  13. 断开缆线与node2上的集群端口e3b的连接、然后使用SN2100交换机支持的相应布线方式将e3b连接到集群交换机SW2上的端口4。

  14. 在交换机SW2上、启用所有面向节点的端口。

    显示示例

    以下命令可在交换机SW2上启用面向节点的端口:

    cumulus@sw2:~$ net del interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@sw2:~$ net pending
    cumulus@sw2:~$ net commit
  15. 在交换机SW2上、验证所有端口是否均已启动:

    net show interface all

    显示示例
    cumulus@sw2:~$ net show interface all
    
    State  Name      Spd   MTU    Mode       LLDP            Summary
    -----  --------- ----  -----  ---------- --------------- --------
    ...
    DN     swp1s0    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp1s1    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp1s2    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp1s3    10G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s0    25G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s1    25G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s2    25G   9216   Trunk/L2                   Master: br_default(UP)
    DN     swp2s3    25G   9216   Trunk/L2                   Master: br_default(UP)
    UP     swp3      100G  9216   Trunk/L2    node1 (e3b)    Master: br_default(UP)
    UP     swp4      100G  9216   Trunk/L2    node2 (e3b)    Master: br_default(UP)
    ...
    ...
    UP     swp15     100G  9216   BondMember  swp15          Master: cluster_isl(UP)
    UP     swp16     100G  9216   BondMember  swp16          Master: cluster_isl(UP)
    ...
  16. 在两个交换机sw1和SW2上、验证两个节点与每个交换机都有一个连接:

    net show lldp

    显示示例

    以下示例显示了交换机sw1和SW2的相应结果:

    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3a
    swp4       100G   Trunk/L2    node2              e3a
    swp15      100G   BondMember  sw2                swp15
    swp16      100G   BondMember  sw2                swp16
    
    cumulus@sw2:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3b
    swp4       100G   Trunk/L2    node2              e3b
    swp15      100G   BondMember  sw1                swp15
    swp16      100G   BondMember  sw1                swp16

第3步:完成操作步骤

  1. 显示有关集群中发现的网络设备的信息:

    net device-discovery show -protocol lldp

    显示示例
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
    ----------- ------ ------------------------- ------------  ----------------
    node1      /lldp
                e3a    sw1 (b8:ce:f6:19:1a:7e)   swp3          -
                e3b    sw2 (b8:ce:f6:19:1b:96)   swp3          -
    node2      /lldp
                e3a    sw1 (b8:ce:f6:19:1a:7e)   swp4          -
                e3b    sw2 (b8:ce:f6:19:1b:96)   swp4          -
  2. 验证所有集群端口是否均已启动:

    network port show -ipspace cluster

    显示示例

    以下示例显示 node1 和 node2 上的所有集群端口均已启动:

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                           Ignore
                                                      Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link MTU  Admin/Oper  Status   Status
    --------- ------------ ---------------- ---- ---- ----------- -------- ------
    e3a       Cluster      Cluster          up   9000  auto/10000 healthy  false
    e3b       Cluster      Cluster          up   9000  auto/10000 healthy  false
    
    Node: node2
                                                                           Ignore
                                                      Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link MTU  Admin/Oper  Status   Status
    --------- ------------ ---------------- ---- ---- ----------- -------- ------
    e3a       Cluster      Cluster          up   9000  auto/10000 healthy  false
    e3b       Cluster      Cluster          up   9000  auto/10000 healthy  false
  3. 在所有集群LIF上启用自动还原:

    net interface modify -vserver Cluster -lif * -auto-revert true

    显示示例
    cluster1::*> net interface modify -vserver Cluster -lif * -auto-revert true
    
              Logical
    Vserver   Interface     Auto-revert
    --------- ------------- ------------
    Cluster
              node1_clus1   true
              node1_clus2   true
              node2_clus1   true
              node2_clus2   true
  4. 验证 Is Home 的所有接口是否均显示 true :

    net interface show -vserver Cluster

    备注 此操作可能需要一分钟才能完成。
    显示示例

    以下示例显示 node1 和 node2 上的所有 LIF 均已启动,并且 为 Home 结果为 true :

    cluster1::*> net interface show -vserver Cluster
    
              Logical      Status     Network            Current    Current Is
    Vserver   Interface    Admin/Oper Address/Mask       Node       Port    Home
    --------- ------------ ---------- ------------------ ---------- ------- ----
    Cluster
              node1_clus1  up/up      169.254.209.69/16  node1      e3a     true
              node1_clus2  up/up      169.254.49.125/16  node1      e3b     true
              node2_clus1  up/up      169.254.47.194/16  node2      e3a     true
              node2_clus2  up/up      169.254.19.183/16  node2      e3b     true
  5. 验证这些设置是否已禁用:

    network options switchless-cluster show

    显示示例

    以下示例中的 false 输出显示配置设置已禁用:

    cluster1::*> network options switchless-cluster show
    Enable Switchless Cluster: false
  6. 验证集群中节点成员的状态:

    cluster show

    显示示例

    以下示例显示了有关集群中节点的运行状况和资格的信息:

    cluster1::*> cluster show
    
    Node                 Health  Eligibility   Epsilon
    -------------------- ------- ------------  --------
    node1                true    true          false
    node2                true    true          false
  7. 确保集群网络具有完全连接:

    cluster ping-cluster -node node-name

    显示示例
    cluster1::*> cluster ping-cluster -node node1
    Host is node1
    Getting addresses from network interface table...
    Cluster node1_clus1 169.254.209.69 node1 e3a
    Cluster node1_clus2 169.254.49.125 node1 e3b
    Cluster node2_clus1 169.254.47.194 node2 e3a
    Cluster node2_clus2 169.254.19.183 node2 e3b
    Local = 169.254.47.194 169.254.19.183
    Remote = 169.254.209.69 169.254.49.125
    Cluster Vserver Id = 4294967293
    Ping status:
    
    Basic connectivity succeeds on 4 path(s)
    Basic connectivity fails on 0 path(s)
    
    Detected 9000 byte MTU on 4 path(s):
    Local 169.254.47.194 to Remote 169.254.209.69
    Local 169.254.47.194 to Remote 169.254.49.125
    Local 169.254.19.183 to Remote 169.254.209.69
    Local 169.254.19.183 to Remote 169.254.49.125
    Larger than PMTU communication succeeds on 4 path(s)
    RPC status:
    2 paths up, 0 paths down (tcp check)
    2 paths up, 0 paths down (udp check)
  8. 使用以下命令启用以太网交换机运行状况监控器日志收集功能,以收集交换机相关的日志文件:

    ssystem switch Ethernet log setup-password`和`ssystem switch Ethernet log enable-Collection

    输入: ssystem switch Ethernet log setup-password

    显示示例
    cluster1::*> system switch ethernet log setup-password
    Enter the switch name: <return>
    The switch name entered is not recognized.
    Choose from the following list:
    sw1
    sw2
    
    cluster1::*> system switch ethernet log setup-password
    
    Enter the switch name: sw1
    RSA key fingerprint is e5:8b:c6:dc:e2:18:18:09:36:63:d9:63:dd:03:d9:cc
    Do you want to continue? {y|n}::[n] y
    
    Enter the password: <enter switch password>
    Enter the password again: <enter switch password>
    
    cluster1::*> system switch ethernet log setup-password
    
    Enter the switch name: sw2
    RSA key fingerprint is 57:49:86:a1:b9:80:6a:61:9a:86:8e:3c:e3:b7:1f:b1
    Do you want to continue? {y|n}:: [n] y
    
    Enter the password: <enter switch password>
    Enter the password again: <enter switch password>

    后跟:

    s系统交换机以太网日志 enable-Collection

    显示示例
    cluster1::*> system switch ethernet log enable-collection
    
    Do you want to enable cluster log collection for all nodes in the cluster?
    {y|n}: [n] y
    
    Enabling cluster switch log collection.
    
    cluster1::*>
    备注 如果其中任何一个命令返回错误,请联系 NetApp 支持部门。
  9. 启动交换机日志收集功能:

    system switch ethernet log collect -device *

    等待10分钟、然后使用命令检查日志收集是否成功:

    system switch ethernet log show

    显示示例
    cluster1::*> system switch ethernet log show
    Log Collection Enabled: true
    
    Index  Switch                       Log Timestamp        Status
    ------ ---------------------------- -------------------  ---------    
    1      sw1 (b8:ce:f6:19:1b:42)      4/29/2022 03:05:25   complete   
    2      sw2 (b8:ce:f6:19:1b:96)      4/29/2022 03:07:42   complete
  10. 将权限级别重新更改为 admin :

    set -privilege admin

  11. 如果禁止自动创建案例,请通过调用 AutoSupport 消息重新启用它:

    ssystem node AutoSupport invoke -node * -type all -message MAINT=end