NVIDIA SN2100 클러스터 스위치를 교체합니다
클러스터 네트워크에서 결함이 있는 NVIDIA SN2100 스위치를 교체하려면 다음 절차를 따르십시오. 이 절차는 NDU(무중단 절차)입니다.
요구사항 검토
다음을 확인합니다.
-
기존 클러스터가 완전하게 작동하는 것으로 확인되고 하나 이상의 완전히 연결된 클러스터 스위치가 있습니다.
-
모든 클러스터 포트가 작동 중입니다.
-
모든 클러스터 논리 인터페이스(LIF)가 홈 포트에 있습니다.
-
ONTAP
cluster ping-cluster -node node1
Command는 모든 경로에서 기본 접속과 PMTU 통신 이상의 통신이 성공했음을 나타냅니다.
다음을 확인합니다.
-
교체 스위치의 관리 네트워크 연결이 작동합니다.
-
교체 스위치에 대한 콘솔 액세스가 있습니다.
-
노드 연결은 swp1~swp14 포트 입니다.
-
포트 swp15 및 swp16에서 모든 ISL(Inter-Switch Link) 포트가 비활성화됩니다.
-
원하는 RCF(Reference Configuration File) 및 Cumulus 운영 체제 이미지 스위치가 스위치에 로드됩니다.
-
스위치의 초기 사용자 정의가 완료되었습니다.
또한 STP, SNMP 및 SSH 등의 이전 사이트 사용자 지정이 새 스위치에 복사되는지 확인합니다.
클러스터 LIF가 호스팅된 노드에서 클러스터 LIF를 마이그레이션하기 위한 명령을 실행해야 합니다. |
콘솔 로깅을 활성화합니다
NetApp은 사용 중인 장치에서 콘솔 로깅을 사용하도록 설정하고 스위치를 교체할 때 다음 작업을 수행할 것을 적극 권장합니다.
-
유지 관리 중에는 AutoSupport를 활성화된 상태로 둡니다.
-
유지 관리 전후에 유지 관리 AutoSupport를 트리거하여 유지 보수 기간 동안 케이스 생성을 비활성화합니다. 이 기술 자료 문서를 참조하십시오 "SU92: 예약된 유지 관리 기간 동안 자동 케이스 생성을 억제하는 방법" 를 참조하십시오.
-
모든 CLI 세션에 대해 세션 로깅을 설정합니다. 세션 로깅을 활성화하는 방법에 대한 지침은 이 기술 자료 문서의 "로깅 세션 출력" 섹션을 참조하십시오 "ONTAP 시스템에 대한 최적의 연결을 위해 PuTTY를 구성하는 방법".
스위치를 교체합니다
이 절차의 예에서는 다음 스위치 및 노드 명명법을 사용합니다.
-
기존 NVIDIA SN2100 스위치의 이름은 _SW1_와 _SW2_입니다.
-
새 NVIDIA SN2100 스위치의 이름은 _nsw2_입니다.
-
노드 이름은 _node1_and_node2_입니다.
-
각 노드의 클러스터 포트 이름은 _e3a_와 _e3b_입니다.
-
클러스터 LIF 이름은 노드 1의 경우 _node1_clus1_and_node1_clus2_이고, 노드 2의 경우 _node2_clus1_and_node2_clus2_입니다.
-
모든 클러스터 노드의 변경 프롬프트는 'cluster1:: * >'입니다
-
브레이크아웃 포트는 SWP [port]s [브레이크아웃 포트 0-3] 형식을 사용합니다. 예를 들어 swp1의 4개의 브레이크아웃 포트는 swp1s0, swp1s1, swp1s2 및 _swp1s3_입니다.
이 절차는 다음과 같은 클러스터 네트워크 토폴로지를 기반으로 합니다.
토폴로지 예를 보여 줍니다
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ---- ------------ -------- ------ e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false cluster1::*> network interface show -vserver Cluster Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- Cluster node1_clus1 up/up 169.254.209.69/16 node1 e3a true node1_clus2 up/up 169.254.49.125/16 node1 e3b true node2_clus1 up/up 169.254.47.194/16 node2 e3a true node2_clus2 up/up 169.254.19.183/16 node2 e3b true cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ------------ ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b sw2 (b8:ce:f6:19:1b:96) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b sw2 (b8:ce:f6:19:1b:96) swp4 -
를 누릅니다
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 sw2 e3a swp4 100G Trunk/L2 sw2 e3a swp15 100G BondMember sw2 swp15 swp16 100G BondMember sw2 swp16 cumulus@sw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 sw1 e3b swp4 100G Trunk/L2 sw1 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
1단계: 교체 준비
-
이 클러스터에서 AutoSupport가 활성화되어 있는 경우 AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다.
'System node AutoSupport invoke-node * -type all-message maINT=xh'
여기서 _x_는 유지보수 기간(시간)입니다.
-
권한 수준을 고급으로 변경하고 계속할 것인지 묻는 메시지가 표시되면 * y * 를 입력합니다.
세트 프리빌리지 고급
고급 프롬프트(*>)가 나타납니다.
-
스위치에 적절한 RCF 및 이미지를 설치하고 nsw2를 설치한 후 필요한 현장 준비를 합니다.
필요한 경우 새 스위치에 적합한 RCF 및 Cumulus 소프트웨어 버전을 확인, 다운로드 및 설치합니다.
-
클러스터 스위치에 적용할 수 있는 Cumulus 소프트웨어는 _NVIDIA Support_site에서 다운로드할 수 있습니다. 다운로드 페이지의 단계에 따라 설치하려는 ONTAP 소프트웨어 버전에 맞는 Cumulus Linux를 다운로드하십시오.
-
에서 적절한 RCF를 사용할 수 있습니다 "_NVIDIA 클러스터 및 스토리지 스위치 _" 페이지. 다운로드 페이지의 단계에 따라 설치하는 ONTAP 소프트웨어 버전에 맞는 올바른 RCF를 다운로드하십시오.
-
2단계: 포트 및 케이블 연결 구성
-
새 스위치 nsw2에서 admin으로 로그인하고 노드 클러스터 인터페이스에 연결할 모든 포트(포트 swp1~swp14)를 종료합니다.
클러스터 노드의 LIF는 각 노드의 다른 클러스터 포트로 페일오버했어야 합니다.
예제 보기
cumulus@nsw2:~$ net add interface swp1s0-3, swp2s0-3, swp3-14 link down cumulus@nsw2:~$ net pending cumulus@nsw2:~$ net commit
-
클러스터 LIF에서 자동 되돌리기 사용 안 함:
'network interface modify -vserver Cluster-lif * -auto-revert false'
예제 보기
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert false Warning: Disabling the auto-revert feature of the cluster logical interface may effect the availability of your cluster network. Are you sure you want to continue? {y|n}: y
-
모든 클러스터 LIF에서 자동 되돌리기 기능이 설정되어 있는지 확인합니다.
net interface show -vserver Cluster -fields auto-revert
-
SN2100 스위치 SW1에서 ISL 포트 swp15 및 swp16을 종료합니다.
예제 보기
cumulus@sw1:~$ net add interface swp15-16 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit
-
SN2100 SW1 스위치에서 모든 케이블을 분리한 다음 SN2100 nsw2 스위치의 동일한 포트에 연결합니다.
-
SW1과 nsw2 스위치 사이에 ISL 포트 swp15와 swp16을 불러옵니다.
예제 보기
다음 명령을 실행하면 스위치 SW1에서 ISL 포트 swp15 및 swp16이 활성화됩니다.
cumulus@sw1:~$ net del interface swp15-16 link down cumulus@sw1:~$ net pending cumulus@sw1:~$ net commit
다음 예에서는 스위치 SW1에서 ISL 포트가 작동 중인 것을 보여 줍니다.
cumulus@sw1:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- -------------- ---------------------- ... ... UP swp15 100G 9216 BondMember nsw2 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember nsw2 (swp16) Master: cluster_isl(UP)
+ 다음 예에서는 스위치 nsw2에서 ISL 포트가 작동되고 있음을 보여 줍니다.
를 누릅니다
cumulus@nsw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ------------- ----------------------- ... ... UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
포트를 확인합니다
e3b
모든 노드에서 작동:네트워크 포트 표시 - IPSpace 클러스터
예제 보기
출력은 다음과 비슷해야 합니다.
cluster1::*> network port show -ipspace Cluster Node: node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ------------ -------- ------- e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ---- ----- ----------- --------- ------- e3a Cluster Cluster up 9000 auto/100000 healthy false e3b Cluster Cluster up 9000 auto/100000 healthy false
-
이제 각 노드의 클러스터 포트가 노드의 관점에서 클러스터 스위치에 다음과 같은 방식으로 연결됩니다.
예제 보기
cluster1::*> network device-discovery show -protocol lldp Node/ Local Discovered Protocol Port Device (LLDP: ChassisID) Interface Platform ----------- ------ ------------------------- ------------ ---------------- node1 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp3 - e3b nsw2 (b8:ce:f6:19:1b:b6) swp3 - node2 /lldp e3a sw1 (b8:ce:f6:19:1a:7e) swp4 - e3b nsw2 (b8:ce:f6:19:1b:b6) swp4 -
-
모든 노드 클러스터 포트가 작동하는지 확인합니다.
net show interface
예제 보기
cumulus@nsw2:~$ net show interface State Name Spd MTU Mode LLDP Summary ----- ----------- ---- ----- ---------- ----------------- ---------------------- ... ... UP swp3 100G 9216 Trunk/L2 Master: bridge(UP) UP swp4 100G 9216 Trunk/L2 Master: bridge(UP) UP swp15 100G 9216 BondMember sw1 (swp15) Master: cluster_isl(UP) UP swp16 100G 9216 BondMember sw1 (swp16) Master: cluster_isl(UP)
-
두 노드 모두 각 스위치에 하나씩 연결되어 있는지 확인합니다.
net show lldp
예제 보기
다음 예에서는 두 스위치에 대해 적절한 결과를 보여 줍니다.
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember nsw2 swp15 swp16 100G BondMember nsw2 swp16 cumulus@nsw2:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- ----------------- ----------- swp3 100G Trunk/L2 node1 e3b swp4 100G Trunk/L2 node2 e3b swp15 100G BondMember sw1 swp15 swp16 100G BondMember sw1 swp16
-
클러스터 LIF에서 자동 되돌리기 사용:
cluster1::*> network interface modify -vserver Cluster -lif * -auto-revert true
-
스위치 nsw2에서 노드의 네트워크 포트에 연결된 포트를 불러옵니다.
예제 보기
cumulus@nsw2:~$ net del interface swp1-14 link down cumulus@nsw2:~$ net pending cumulus@nsw2:~$ net commit
-
클러스터의 노드에 대한 정보를 표시합니다.
'클러스터 쇼'
예제 보기
이 예제에서는 이 클러스터의 노드 1과 노드 2에 대한 노드 상태가 true인 것을 보여 줍니다.
cluster1::*> cluster show Node Health Eligibility ------------- ------- ------------ node1 true true node2 true true
-
모든 물리적 클러스터 포트가 작동하는지 확인합니다.
네트워크 포트에는 IPSpace 클러스터가 표시됩니다
예제 보기
cluster1::*> network port show -ipspace Cluster Node node1 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ----------- ----------------- ----- ----- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false Node: node2 Ignore Speed(Mbps) Health Health Port IPspace Broadcast Domain Link MTU Admin/Oper Status Status --------- ------------ ---------------- ----- ----- ----------- -------- ------ e3a Cluster Cluster up 9000 auto/10000 healthy false e3b Cluster Cluster up 9000 auto/10000 healthy false
3단계: 구성을 확인합니다
-
클러스터 네트워크가 정상인지 확인합니다.
예제 보기
cumulus@sw1:~$ net show lldp LocalPort Speed Mode RemoteHost RemotePort --------- ----- ---------- -------------- ----------- swp3 100G Trunk/L2 node1 e3a swp4 100G Trunk/L2 node2 e3a swp15 100G BondMember nsw2 swp15 swp16 100G BondMember nsw2 swp16
-
권한 수준을 admin으로 다시 변경합니다.
'Set-Privilege admin'입니다
-
자동 케이스 생성을 억제한 경우 AutoSupport 메시지를 호출하여 다시 활성화합니다.
'System node AutoSupport invoke-node * -type all-message maINT=end'