I/O 모듈-FAS9000을 교체합니다
입출력 모듈을 교체하려면 특정 작업 순서를 수행해야 합니다.
-
이 절차는 시스템에서 지원하는 모든 버전의 ONTAP에서 사용할 수 있습니다
-
시스템의 다른 모든 구성 요소가 올바르게 작동해야 합니다. 그렇지 않은 경우 기술 지원 부서에 문의해야 합니다.
1단계: 손상된 컨트롤러를 종료합니다
스토리지 시스템 하드웨어 구성에 따라 다른 절차를 사용하여 손상된 컨트롤러를 종료하거나 인수할 수 있습니다.
손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공할 수 있도록 컨트롤러를 인수해야 합니다.
-
SAN 시스템을 사용하는 경우 손상된 컨트롤러 SCSI 블레이드에 대한 이벤트 메시지를 확인해야
cluster kernel-service show`합니다. priv advanced 모드에서 명령을 실행하면 `cluster kernel-service show
해당 노드의 노드 이름"쿼럼 상태입니다", 해당 노드의 가용성 상태 및 해당 노드의 작동 상태가 표시됩니다.각 SCSI 블레이드 프로세스는 클러스터의 다른 노드와 함께 쿼럼에 있어야 합니다. 교체를 진행하기 전에 모든 문제를 해결해야 합니다.
-
노드가 2개 이상인 클러스터가 있는 경우 쿼럼에 있어야 합니다. 클러스터가 쿼럼에 없거나 정상 컨트롤러에 자격 및 상태에 대해 FALSE가 표시되는 경우 손상된 컨트롤러를 종료하기 전에 문제를 해결해야 합니다(참조) "노드를 클러스터와 동기화합니다".
-
AutoSupport가 활성화된 경우 AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다.
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
다음 AutoSupport 메시지는 2시간 동안 자동 케이스 생성을 억제합니다.
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
정상 상태의 컨트롤러 콘솔에서 자동 반환 비활성화:
storage failover modify -node local -auto-giveback false
자동 반환을 비활성화하시겠습니까?_가 표시되면 'y'를 입력합니다. -
손상된 컨트롤러를 로더 프롬프트로 가져가십시오.
손상된 컨트롤러가 표시되는 경우… 그러면… LOADER 메시지가 표시됩니다
다음 단계로 이동합니다.
반환 대기 중…
Ctrl-C를 누른 다음 메시지가 나타나면 y를 누릅니다.
시스템 프롬프트 또는 암호 프롬프트
정상적인 컨트롤러 'storage failover takeover -ofnode_impaired_node_name_'에서 손상된 컨트롤러를 인수하거나 중단합니다
손상된 컨트롤러에 기브백을 기다리는 중… 이 표시되면 Ctrl-C를 누른 다음 y를 응답합니다.
손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 컨트롤러 전원을 전환하여 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공하도록 해야 합니다.
-
정상 컨트롤러에 전원을 공급하려면 이 절차의 마지막에 전원 공급 장치를 켜 두어야 합니다.
-
MetroCluster 상태를 확인하여 장애가 있는 컨트롤러가 자동으로 정상 컨트롤러(MetroCluster show)로 전환되었는지 확인합니다
-
자동 절체가 발생했는지 여부에 따라 다음 표에 따라 진행합니다.
컨트롤러 손상 여부 그러면… 가 자동으로 전환되었습니다
다음 단계를 진행합니다.
가 자동으로 전환되지 않았습니다
정상 컨트롤러 MetroCluster 절체 기능을 통해 계획된 절체 동작을 수행한다
가 자동으로 전환되지 않고, 'MetroCluster switchover' 명령으로 전환을 시도했으며, 스위치오버가 거부되었습니다
거부권 메시지를 검토하고 가능한 경우 문제를 해결한 후 다시 시도하십시오. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.
-
정상적인 클러스터에서 'MetroCluster 환원 단계 집계' 명령을 실행하여 데이터 애그리게이트를 재동기화합니다.
controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
치유가 거부되면 '-override-vetoes' 매개 변수를 사용하여 'MetroCluster 환원' 명령을 재실행할 수 있습니다. 이 선택적 매개 변수를 사용하는 경우 시스템은 복구 작업을 방지하는 모든 소프트 베인을 재정의합니다.
-
MetroCluster operation show 명령을 사용하여 작업이 완료되었는지 확인합니다.
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
'storage aggregate show' 명령을 사용하여 애그리게이트의 상태를 확인하십시오.
controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
MetroCluster 환원 단계 루트 애그리게이트( heal-phase root-aggregate) 명령을 사용하여 루트 애그리게이트를 수정합니다.
mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
치유가 거부되면 -override-vetoes 매개변수를 사용하여 'MetroCluster 환원' 명령을 재실행할 수 있습니다. 이 선택적 매개 변수를 사용하는 경우 시스템은 복구 작업을 방지하는 모든 소프트 베인을 재정의합니다.
-
대상 클러스터에서 'MetroCluster operation show' 명령을 사용하여 환원 작업이 완료되었는지 확인합니다.
mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
손상된 컨트롤러 모듈에서 전원 공급 장치를 분리합니다.
2단계: I/O 모듈을 교체합니다
I/O 모듈을 교체하려면 섀시 내에서 해당 모듈을 찾아 특정 단계를 따르십시오.
-
아직 접지되지 않은 경우 올바르게 접지하십시오.
-
대상 I/O 모듈과 연결된 모든 케이블을 뽑습니다.
케이블을 어디에 연결했는지 알 수 있도록 케이블에 레이블을 지정해야 합니다.
-
섀시에서 대상 I/O 모듈을 분리합니다.
-
문자 및 번호가 매겨진 캠 버튼을 누릅니다.
캠 버튼이 섀시에서 멀어져 있습니다.
-
캠 래치가 수평 위치에 올 때까지 아래로 돌립니다.
I/O 모듈이 섀시에서 분리되어 I/O 슬롯에서 약 1.3cm 정도 이동합니다.
-
모듈 면의 측면에 있는 당김 탭을 당겨 섀시에서 I/O 모듈을 분리합니다.
입출력 모듈이 있던 슬롯을 추적해야 합니다.
문자 및 숫자 I/O 캠 래치
I/O 캠 래치가 완전히 잠금 해제되었습니다
-
-
입출력 모듈을 따로 보관해 둡니다.
-
I/O 모듈이 문자 및 번호가 매겨진 I/O 캠 래치가 I/O 캠 핀과 맞물릴 때까지 I/O 모듈을 슬롯에 부드럽게 밀어 넣은 다음 I/O 캠 래치를 완전히 위로 밀어 모듈을 제자리에 고정합니다.
-
필요에 따라 입출력 모듈을 다시 장착합니다.
3단계: I/O 모듈 교체 후 컨트롤러를 재부팅합니다
I/O 모듈을 교체한 후 컨트롤러 모듈을 재부팅해야 합니다.
새 입출력 모듈이 장애가 발생한 모듈과 다른 모델인 경우 먼저 BMC를 재부팅해야 합니다. |
-
교체 모듈이 이전 모듈과 다른 모델인 경우 BMC를 재부팅합니다.
-
LOADER 프롬프트에서 advanced privilege mode: priv set advanced로 변경합니다
-
BMC:'s p reboot'를 재부팅합니다
-
-
LOADER 프롬프트에서 bye 노드를 재부팅합니다
이렇게 하면 PCIe 카드 및 기타 구성 요소가 다시 초기화되고 노드가 재부팅됩니다. -
시스템이 10GbE 클러스터 상호 연결과 40GbE NIC 또는 온보드 포트의 데이터 연결을 지원하도록 구성된 경우 유지보수 모드에서 'nicadmin convert' 명령을 사용하여 이러한 포트를 10GbE 연결로 변환합니다.
변환을 완료한 후 유지보수 모드를 종료해야 합니다. -
노드를 정상 작동 상태로 되돌리십시오: 'storage failover 반환 - ofnode_impaired_node_name_'
-
자동 반환이 비활성화된 경우 'Storage failover modify -node local -auto-반환 true'를 다시 설정합니다
시스템이 2노드 MetroCluster 구성인 경우, 다음 단계에 설명된 대로 애그리게이트를 다시 전환해야 합니다.
4단계: 2노드 MetroCluster 구성에서 애그리게이트를 다시 전환합니다
2노드 MetroCluster 구성에서 FRU 교체를 완료한 후에는 MetroCluster 스위치백 작업을 수행할 수 있습니다. 그러면 이전 사이트의 SVM(Sync-Source Storage Virtual Machine)이 활성 상태이고 로컬 디스크 풀에서 데이터를 제공하는 구성을 정상 운영 상태로 되돌릴 수 있습니다.
이 작업은 2노드 MetroCluster 구성에만 적용됩니다.
-
모든 노드가 "enabled" 상태(MetroCluster node show)에 있는지 확인합니다
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A controller_A_1 configured enabled heal roots completed cluster_B controller_B_1 configured enabled waiting for switchback recovery 2 entries were displayed.
-
모든 SVM에서 재동기화가 완료되었는지 확인합니다. 'MetroCluster vserver show'
-
복구 작업에 의해 수행되는 자동 LIF 마이그레이션이 'MetroCluster check lif show'에 성공적으로 완료되었는지 확인합니다
-
정상적인 클러스터에 있는 모든 노드에서 'MetroCluster 스위치백' 명령을 사용하여 스위치백을 수행합니다.
-
스위치백 작업이 완료되었는지 확인합니다. 'MetroCluster show'
클러스터가 "대기 중 - 스위치백" 상태에 있으면 스위치백 작업이 여전히 실행 중입니다.
cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured switchover Remote: cluster_A configured waiting-for-switchback
클러스터가 '정상' 상태에 있으면 스위치백 작업이 완료됩니다.
cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured normal Remote: cluster_A configured normal
스위치백을 완료하는 데 시간이 오래 걸리는 경우 MetroCluster config-replication resync resync-status show 명령을 사용하여 진행 중인 기준선의 상태를 확인할 수 있습니다.
-
SnapMirror 또는 SnapVault 구성을 다시 설정합니다.
5단계: 장애가 발생한 부품을 NetApp에 반환
키트와 함께 제공된 RMA 지침에 설명된 대로 오류가 발생한 부품을 NetApp에 반환합니다. "부품 반환 및 교체"자세한 내용은 페이지를 참조하십시오.