Skip to main content
Cluster and storage switches
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

NVIDIA SN2100 클러스터 스위치를 교체합니다

기여자

클러스터 네트워크에서 결함이 있는 NVIDIA SN2100 스위치를 교체하려면 다음 절차를 따르십시오. 이 절차는 NDU(무중단 절차)입니다.

요구사항 검토

기존 클러스터 및 네트워크 인프라

다음을 확인합니다.

  • 기존 클러스터가 완전하게 작동하는 것으로 확인되고 하나 이상의 완전히 연결된 클러스터 스위치가 있습니다.

  • 모든 클러스터 포트가 작동 중입니다.

  • 모든 클러스터 논리 인터페이스(LIF)가 홈 포트에 있습니다.

  • ONTAP cluster ping-cluster -node node1 Command는 모든 경로에서 기본 접속과 PMTU 통신 이상의 통신이 성공했음을 나타냅니다.

NVIDIA SN2100 교체 스위치

다음을 확인합니다.

  • 교체 스위치의 관리 네트워크 연결이 작동합니다.

  • 교체 스위치에 대한 콘솔 액세스가 있습니다.

  • 노드 연결은 swp1~swp14 포트 입니다.

  • 포트 swp15 및 swp16에서 모든 ISL(Inter-Switch Link) 포트가 비활성화됩니다.

  • 원하는 RCF(Reference Configuration File) 및 Cumulus 운영 체제 이미지 스위치가 스위치에 로드됩니다.

  • 스위치의 초기 사용자 정의가 완료되었습니다.

또한 STP, SNMP 및 SSH 등의 이전 사이트 사용자 지정이 새 스위치에 복사되는지 확인합니다.

참고 클러스터 LIF가 호스팅된 노드에서 클러스터 LIF를 마이그레이션하기 위한 명령을 실행해야 합니다.

콘솔 로깅을 활성화합니다

NetApp은 사용 중인 장치에서 콘솔 로깅을 사용하도록 설정하고 스위치를 교체할 때 다음 작업을 수행할 것을 적극 권장합니다.

스위치를 교체합니다

예를 참조하십시오

이 절차의 예에서는 다음 스위치 및 노드 명명법을 사용합니다.

  • 기존 NVIDIA SN2100 스위치의 이름은 _SW1_와 _SW2_입니다.

  • 새 NVIDIA SN2100 스위치의 이름은 _nsw2_입니다.

  • 노드 이름은 _node1_and_node2_입니다.

  • 각 노드의 클러스터 포트 이름은 _e3a_와 _e3b_입니다.

  • 클러스터 LIF 이름은 노드 1의 경우 _node1_clus1_and_node1_clus2_이고, 노드 2의 경우 _node2_clus1_and_node2_clus2_입니다.

  • 모든 클러스터 노드의 변경 프롬프트는 'cluster1:: * >'입니다

  • 브레이크아웃 포트는 SWP [port]s [브레이크아웃 포트 0-3] 형식을 사용합니다. 예를 들어 swp1의 4개의 브레이크아웃 포트는 swp1s0, swp1s1, swp1s2 및 _swp1s3_입니다.

클러스터 네트워크 토폴로지 정보

이 절차는 다음과 같은 클러스터 네트워크 토폴로지를 기반으로 합니다.

토폴로지 예를 보여 줍니다
cluster1::*> network port show -ipspace Cluster

Node: node1
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false

Node: node2
                                                                        Ignore
                                                  Speed(Mbps)  Health   Health
Port      IPspace      Broadcast Domain Link MTU  Admin/Oper   Status   Status
--------- ------------ ---------------- ---- ---- ------------ -------- ------
e3a       Cluster      Cluster          up   9000  auto/100000 healthy  false
e3b       Cluster      Cluster          up   9000  auto/100000 healthy  false


cluster1::*> network interface show -vserver Cluster

            Logical    Status     Network            Current       Current Is
Vserver     Interface  Admin/Oper Address/Mask       Node          Port    Home
----------- ---------- ---------- ------------------ ------------- ------- ----
Cluster
            node1_clus1  up/up    169.254.209.69/16  node1         e3a     true
            node1_clus2  up/up    169.254.49.125/16  node1         e3b     true
            node2_clus1  up/up    169.254.47.194/16  node2         e3a     true
            node2_clus2  up/up    169.254.19.183/16  node2         e3b     true


cluster1::*> network device-discovery show -protocol lldp
Node/       Local  Discovered
Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
----------- ------ ------------------------- ------------  ----------------
node1      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp3          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp3          -
node2      /lldp
            e3a    sw1 (b8:ce:f6:19:1a:7e)   swp4          -
            e3b    sw2 (b8:ce:f6:19:1b:96)   swp4          -

를 누릅니다

cumulus@sw1:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw2                e3a
swp4       100G   Trunk/L2    sw2                e3a
swp15      100G   BondMember  sw2                swp15
swp16      100G   BondMember  sw2                swp16


cumulus@sw2:~$ net show lldp

LocalPort  Speed  Mode        RemoteHost         RemotePort
---------  -----  ----------  -----------------  -----------
swp3       100G   Trunk/L2    sw1                e3b
swp4       100G   Trunk/L2    sw1                e3b
swp15      100G   BondMember  sw1                swp15
swp16      100G   BondMember  sw1                swp16

1단계: 교체 준비

  1. 이 클러스터에서 AutoSupport가 활성화되어 있는 경우 AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다.

    'System node AutoSupport invoke-node * -type all-message maINT=xh'

    여기서 _x_는 유지보수 기간(시간)입니다.

  2. 권한 수준을 고급으로 변경하고 계속할 것인지 묻는 메시지가 표시되면 * y * 를 입력합니다.

    세트 프리빌리지 고급

    고급 프롬프트(*>)가 나타납니다.

  3. 스위치에 적절한 RCF 및 이미지를 설치하고 nsw2를 설치한 후 필요한 현장 준비를 합니다.

    필요한 경우 새 스위치에 적합한 RCF 및 Cumulus 소프트웨어 버전을 확인, 다운로드 및 설치합니다.

    1. 클러스터 스위치에 적용할 수 있는 Cumulus 소프트웨어는 _NVIDIA Support_site에서 다운로드할 수 있습니다. 다운로드 페이지의 단계에 따라 설치하려는 ONTAP 소프트웨어 버전에 맞는 Cumulus Linux를 다운로드하십시오.

    2. 에서 적절한 RCF를 사용할 수 있습니다 "_NVIDIA 클러스터 및 스토리지 스위치 _" 페이지. 다운로드 페이지의 단계에 따라 설치하는 ONTAP 소프트웨어 버전에 맞는 올바른 RCF를 다운로드하십시오.

2단계: 포트 및 케이블 연결 구성

  1. 새 스위치 nsw2에서 admin으로 로그인하고 노드 클러스터 인터페이스에 연결할 모든 포트(포트 swp1~swp14)를 종료합니다.

    클러스터 노드의 LIF는 각 노드의 다른 클러스터 포트로 페일오버했어야 합니다.

    예제 보기
    cumulus@nsw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  2. 클러스터 LIF에서 자동 되돌리기 사용 안 함:

    'network interface modify -vserver Cluster-lif * -auto-revert false'

    예제 보기
    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false
    
    Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y
  3. 모든 클러스터 LIF에서 자동 되돌리기 기능이 설정되어 있는지 확인합니다.

    net interface show -vserver Cluster -fields auto-revert

  4. SN2100 스위치 SW1에서 ISL 포트 swp15 및 swp16을 종료합니다.

    예제 보기
    cumulus@sw1:~$ net add interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit
  5. SN2100 SW1 스위치에서 모든 케이블을 분리한 다음 SN2100 nsw2 스위치의 동일한 포트에 연결합니다.

  6. SW1과 nsw2 스위치 사이에 ISL 포트 swp15와 swp16을 불러옵니다.

    예제 보기

    다음 명령을 실행하면 스위치 SW1에서 ISL 포트 swp15 및 swp16이 활성화됩니다.

    cumulus@sw1:~$ net del interface swp15-16 link down
    cumulus@sw1:~$ net pending
    cumulus@sw1:~$ net commit

    다음 예에서는 스위치 SW1에서 ISL 포트가 작동 중인 것을 보여 줍니다.

    cumulus@sw1:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------- ----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  nsw2 (swp15)   Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  nsw2 (swp16)   Master: cluster_isl(UP)

    + 다음 예에서는 스위치 nsw2에서 ISL 포트가 작동되고 있음을 보여 줍니다.

    를 누릅니다

    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP           Summary
    -----  -----------  ----  -----  ----------  -------------  -----------------------
    ...
    ...
    UP     swp15        100G  9216   BondMember  sw1 (swp15)    Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)    Master: cluster_isl(UP)
  7. 포트를 확인합니다 e3b 모든 노드에서 작동:

    네트워크 포트 표시 - IPSpace 클러스터

    예제 보기

    출력은 다음과 비슷해야 합니다.

    cluster1::*> network port show -ipspace Cluster
    
    Node: node1
                                                                             Ignore
                                                       Speed(Mbps)  Health   Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper   Status   Status
    --------- ------------ ---------------- ---- ----- ------------ -------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
    
    
    Node: node2
                                                                             Ignore
                                                       Speed(Mbps) Health    Health
    Port      IPspace      Broadcast Domain Link MTU   Admin/Oper  Status    Status
    --------- ------------ ---------------- ---- ----- ----------- --------- -------
    e3a       Cluster      Cluster          up   9000  auto/100000  healthy  false
    e3b       Cluster      Cluster          up   9000  auto/100000  healthy  false
  8. 이제 각 노드의 클러스터 포트가 노드의 관점에서 클러스터 스위치에 다음과 같은 방식으로 연결됩니다.

    예제 보기
    cluster1::*> network device-discovery show -protocol lldp
    Node/       Local  Discovered
    Protocol    Port   Device (LLDP: ChassisID)  Interface     Platform
    ----------- ------ ------------------------- ------------  ----------------
    node1      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp3          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp3          -
    node2      /lldp
                e3a    sw1  (b8:ce:f6:19:1a:7e)   swp4          -
                e3b    nsw2 (b8:ce:f6:19:1b:b6)   swp4          -
  9. 모든 노드 클러스터 포트가 작동하는지 확인합니다.

    net show interface

    예제 보기
    cumulus@nsw2:~$ net show interface
    
    State  Name         Spd   MTU    Mode        LLDP              Summary
    -----  -----------  ----  -----  ----------  ----------------- ----------------------
    ...
    ...
    UP     swp3         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp4         100G  9216   Trunk/L2                      Master: bridge(UP)
    UP     swp15        100G  9216   BondMember  sw1 (swp15)       Master: cluster_isl(UP)
    UP     swp16        100G  9216   BondMember  sw1 (swp16)       Master: cluster_isl(UP)
  10. 두 노드 모두 각 스위치에 하나씩 연결되어 있는지 확인합니다.

    net show lldp

    예제 보기

    다음 예에서는 두 스위치에 대해 적절한 결과를 보여 줍니다.

    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1              e3a
    swp4       100G   Trunk/L2    node2              e3a
    swp15      100G   BondMember  nsw2               swp15
    swp16      100G   BondMember  nsw2               swp16
    
    
    cumulus@nsw2:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost         RemotePort
    ---------  -----  ----------  -----------------  -----------
    swp3       100G   Trunk/L2    node1                e3b
    swp4       100G   Trunk/L2    node2                e3b
    swp15      100G   BondMember  sw1                swp15
    swp16      100G   BondMember  sw1                swp16
  11. 클러스터 LIF에서 자동 되돌리기 사용:

    cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true

  12. 스위치 nsw2에서 노드의 네트워크 포트에 연결된 포트를 불러옵니다.

    예제 보기
    cumulus@nsw2:~$ net del interface swp1-14 link down
    cumulus@nsw2:~$ net pending
    cumulus@nsw2:~$ net commit
  13. 클러스터의 노드에 대한 정보를 표시합니다.

    '클러스터 쇼'

    예제 보기

    이 예제에서는 이 클러스터의 노드 1과 노드 2에 대한 노드 상태가 true인 것을 보여 줍니다.

    cluster1::*> cluster show
    
    Node          Health  Eligibility
    ------------- ------- ------------
    node1         true    true
    node2         true    true
  14. 모든 물리적 클러스터 포트가 작동하는지 확인합니다.

    네트워크 포트에는 IPSpace 클러스터가 표시됩니다

    예제 보기
    cluster1::*> network port show -ipspace Cluster
    
    Node node1                                                               Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace     Broadcast Domain  Link  MTU   Admin/Oper  Status   Status
    --------- ----------- ----------------- ----- ----- ----------- -------- ------
    e3a       Cluster     Cluster           up    9000  auto/10000  healthy  false
    e3b       Cluster     Cluster           up    9000  auto/10000  healthy  false
    
    Node: node2
                                                                             Ignore
                                                        Speed(Mbps) Health   Health
    Port      IPspace      Broadcast Domain Link  MTU   Admin/Oper  Status   Status
    --------- ------------ ---------------- ----- ----- ----------- -------- ------
    e3a       Cluster      Cluster          up    9000  auto/10000  healthy  false
    e3b       Cluster      Cluster          up    9000  auto/10000  healthy  false

3단계: 구성을 확인합니다

  1. 클러스터 네트워크가 정상인지 확인합니다.

    예제 보기
    cumulus@sw1:~$ net show lldp
    
    LocalPort  Speed  Mode        RemoteHost      RemotePort
    ---------  -----  ----------  --------------  -----------
    swp3       100G   Trunk/L2    node1           e3a
    swp4       100G   Trunk/L2    node2           e3a
    swp15      100G   BondMember  nsw2            swp15
    swp16      100G   BondMember  nsw2            swp16
  2. 권한 수준을 admin으로 다시 변경합니다.

    'Set-Privilege admin'입니다

  3. 자동 케이스 생성을 억제한 경우 AutoSupport 메시지를 호출하여 다시 활성화합니다.

    'System node AutoSupport invoke-node * -type all-message maINT=end'