DIMM-AFF A220을 교체합니다
스토리지 시스템이 스토리지 시스템의 ONTAP 부팅을 방해하는 단일 DIMM 오류로 인해 발생하는 과도한 CECC(수정 가능한 오류 수정 코드) 오류 또는 해결할 수 없는 ECC 오류와 같은 오류가 스토리지 시스템에서 발생하면 컨트롤러의 DIMM을 교체해야 합니다.
시스템의 다른 모든 구성 요소가 올바르게 작동해야 합니다. 그렇지 않은 경우 기술 지원 부서에 문의해야 합니다.
오류가 발생한 구성 요소를 공급업체로부터 받은 교체 FRU 구성 요소로 교체해야 합니다.
1단계: 손상된 컨트롤러를 종료합니다
손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공할 수 있도록 컨트롤러를 인수해야 합니다.
-
SAN 시스템을 사용하는 경우 손상된 컨트롤러 SCSI 블레이드에 대한 이벤트 메시지를 확인해야
cluster kernel-service show`합니다. priv advanced 모드에서 명령을 실행하면 `cluster kernel-service show
해당 노드의 노드 이름"쿼럼 상태입니다", 해당 노드의 가용성 상태 및 해당 노드의 작동 상태가 표시됩니다.각 SCSI 블레이드 프로세스는 클러스터의 다른 노드와 함께 쿼럼에 있어야 합니다. 교체를 진행하기 전에 모든 문제를 해결해야 합니다.
-
노드가 2개 이상인 클러스터가 있는 경우 쿼럼에 있어야 합니다. 클러스터가 쿼럼에 없거나 정상 컨트롤러에 자격 및 상태에 대해 FALSE가 표시되는 경우 손상된 컨트롤러를 종료하기 전에 문제를 해결해야 합니다(참조) "노드를 클러스터와 동기화합니다".
-
AutoSupport가 활성화된 경우 AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다.
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
다음 AutoSupport 메시지는 2시간 동안 자동 케이스 생성을 억제합니다.
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
정상 상태의 컨트롤러 콘솔에서 자동 반환 비활성화:
storage failover modify -node local -auto-giveback false
자동 반환을 비활성화하시겠습니까?_가 표시되면 'y'를 입력합니다. -
손상된 컨트롤러를 로더 프롬프트로 가져가십시오.
손상된 컨트롤러가 표시되는 경우… 그러면… LOADER 메시지가 표시됩니다
다음 단계로 이동합니다.
반환 대기 중…
Ctrl-C를 누른 다음 메시지가 나타나면 y를 누릅니다.
시스템 프롬프트 또는 암호 프롬프트
정상적인 컨트롤러 'storage failover takeover -ofnode_impaired_node_name_'에서 손상된 컨트롤러를 인수하거나 중단합니다
손상된 컨트롤러에 기브백을 기다리는 중… 이 표시되면 Ctrl-C를 누른 다음 y를 응답합니다.
-
시스템에 섀시에 하나의 컨트롤러 모듈만 있는 경우 전원 공급 장치를 끈 다음 손상된 컨트롤러의 전원 코드를 전원에서 분리합니다.
2단계: 컨트롤러 모듈을 분리합니다
컨트롤러 내의 구성 요소에 액세스하려면 먼저 시스템에서 컨트롤러 모듈을 분리한 다음 컨트롤러 모듈의 덮개를 분리해야 합니다.
-
아직 접지되지 않은 경우 올바르게 접지하십시오.
-
케이블을 케이블 관리 장치에 연결하는 후크 및 루프 스트랩을 푼 다음, 케이블이 연결된 위치를 추적하면서 컨트롤러 모듈에서 시스템 케이블과 SFP(필요한 경우)를 분리합니다.
케이블 관리 장치에 케이블을 남겨 두면 케이블 관리 장치를 다시 설치할 때 케이블이 정리됩니다.
-
컨트롤러 모듈의 왼쪽과 오른쪽에서 케이블 관리 장치를 분리하여 한쪽에 둡니다.
-
캠 손잡이의 래치를 꽉 잡고 캠 핸들을 완전히 열어 미드플레인에서 컨트롤러 모듈을 분리한 다음 두 손으로 컨트롤러 모듈을 섀시에서 꺼냅니다.
-
컨트롤러 모듈을 뒤집어 평평하고 안정적인 곳에 놓습니다.
-
파란색 탭을 밀어 덮개를 연 다음 덮개를 위로 돌려 엽니다.
3단계: DIMM을 교체합니다
DIMM을 교체하려면 컨트롤러 내부에서 DIMM을 찾은 후 특정 단계를 따르십시오.
DIMM을 교체할 경우 컨트롤러 모듈에서 NVMEM 배터리를 분리한 후 DIMM을 제거해야 합니다.
-
아직 접지되지 않은 경우 올바르게 접지하십시오.
-
컨트롤러 모듈 뒤쪽의 NVMEM LED를 확인하십시오.
비휘발성 메모리(NVMEM)에서 기록되지 않은 데이터가 손실되지 않도록 시스템 구성요소를 교체하기 전에 완전 시스템 종료를 수행해야 합니다. LED는 컨트롤러 모듈 뒷면에 있습니다. 다음 아이콘을 찾습니다.
-
NVMEM LED가 깜박이지 않으면 NVMEM에 콘텐츠가 없습니다. 다음 단계를 건너뛰고 이 절차의 다음 작업을 진행할 수 있습니다.
-
NVMEM LED가 깜박이면 NVMEM에 데이터가 있으며 메모리를 지우려면 배터리를 분리해야 합니다.
-
배터리를 찾아 배터리 플러그 표면에 있는 클립을 눌러 플러그 소켓에서 잠금 클립을 분리한 다음 소켓에서 배터리 케이블을 분리합니다.
-
NVMEM LED가 더 이상 켜져 있지 않은지 확인합니다.
-
배터리 커넥터를 다시 연결합니다.
-
-
로 돌아갑니다 3단계: DIMM을 교체합니다 NVMEM LED를 다시 확인하려면 이 절차를 수행하십시오.
-
컨트롤러 모듈에서 DIMM을 찾습니다.
-
교체 DIMM을 올바른 방향으로 삽입할 수 있도록 소켓에서 DIMM의 방향을 기록해 두십시오.
-
DIMM의 양쪽에 있는 두 개의 DIMM 이젝터 탭을 천천히 밀어 슬롯에서 DIMM을 꺼낸 다음 슬롯에서 DIMM을 밀어 꺼냅니다.
DIMM 회로 보드의 구성 요소에 압력이 가해질 수 있으므로 DIMM의 가장자리를 조심스럽게 잡으십시오. 시스템 DIMM의 수와 위치는 시스템 모델에 따라 다릅니다.
다음 그림은 시스템 DIMM의 위치를 보여줍니다.
-
정전기 방지 포장용 백에서 교체용 DIMM을 제거하고 DIMM을 모서리에 맞춰 슬롯에 맞춥니다.
DIMM의 핀 사이의 노치가 소켓의 탭과 일직선이 되어야 합니다.
-
커넥터의 DIMM 이젝터 탭이 열린 위치에 있는지 확인한 다음 DIMM을 슬롯에 똑바로 삽입합니다.
DIMM은 슬롯에 단단히 장착되지만 쉽게 장착할 수 있습니다. 그렇지 않은 경우 DIMM을 슬롯에 재정렬하고 다시 삽입합니다.
DIMM이 균일하게 정렬되어 슬롯에 완전히 삽입되었는지 육안으로 검사합니다. -
이젝터 탭이 DIMM 끝 부분의 노치 위에 끼워질 때까지 DIMM의 상단 가장자리를 조심스럽게 단단히 누릅니다.
-
NVMEM 배터리 플러그 소켓을 찾은 다음 배터리 케이블 플러그 전면에 있는 클립을 눌러 소켓에 삽입합니다.
플러그가 컨트롤러 모듈에 잠겼는지 확인합니다.
-
컨트롤러 모듈 덮개를 닫습니다.
4단계: 컨트롤러 모듈을 재설치합니다
컨트롤러 모듈의 구성 요소를 교체한 후 섀시에 다시 설치합니다.
-
아직 접지되지 않은 경우 올바르게 접지하십시오.
-
아직 설치하지 않은 경우 컨트롤러 모듈의 덮개를 다시 끼우십시오.
-
컨트롤러 모듈의 끝을 섀시의 입구에 맞춘 다음 컨트롤러 모듈을 반쯤 조심스럽게 시스템에 밀어 넣습니다.
지시가 있을 때까지 컨트롤러 모듈을 섀시에 완전히 삽입하지 마십시오. -
필요에 따라 시스템을 다시 연결합니다.
미디어 컨버터(QSFP 또는 SFP)를 분리한 경우 광섬유 케이블을 사용하는 경우 다시 설치해야 합니다.
-
컨트롤러 모듈 재설치를 완료합니다.
시스템이 다음 상태인 경우: 그런 다음 다음 다음 단계를 수행하십시오. HA 쌍
컨트롤러 모듈이 섀시에 완전히 장착되면 바로 부팅이 시작됩니다.
-
캠 핸들을 열린 위치에 둔 상태에서 컨트롤러 모듈이 중앙판과 완전히 맞닿고 완전히 장착될 때까지 단단히 누른 다음 캠 핸들을 잠금 위치로 닫습니다.
커넥터가 손상되지 않도록 컨트롤러 모듈을 섀시에 밀어 넣을 때 과도한 힘을 가하지 마십시오. 컨트롤러가 섀시에 장착되면 바로 부팅이 시작됩니다.
-
아직 설치하지 않은 경우 케이블 관리 장치를 다시 설치하십시오.
-
케이블을 후크와 루프 스트랩으로 케이블 관리 장치에 연결합니다.
독립형 구성
-
캠 핸들을 열린 위치에 둔 상태에서 컨트롤러 모듈이 중앙판과 완전히 맞닿고 완전히 장착될 때까지 단단히 누른 다음 캠 핸들을 잠금 위치로 닫습니다.
커넥터가 손상되지 않도록 컨트롤러 모듈을 섀시에 밀어 넣을 때 과도한 힘을 가하지 마십시오. -
아직 설치하지 않은 경우 케이블 관리 장치를 다시 설치하십시오.
-
케이블을 후크와 루프 스트랩으로 케이블 관리 장치에 연결합니다.
-
전원 케이블을 전원 공급 장치와 전원에 다시 연결한 다음 전원을 켜서 부팅 프로세스를 시작합니다.
-
5단계: 2노드 MetroCluster 구성에서 애그리게이트를 다시 전환합니다
2노드 MetroCluster 구성에서 FRU 교체를 완료한 후에는 MetroCluster 스위치백 작업을 수행할 수 있습니다. 그러면 이전 사이트의 SVM(Sync-Source Storage Virtual Machine)이 활성 상태이고 로컬 디스크 풀에서 데이터를 제공하는 구성을 정상 운영 상태로 되돌릴 수 있습니다.
이 작업은 2노드 MetroCluster 구성에만 적용됩니다.
-
모든 노드가 "enabled" 상태(MetroCluster node show)에 있는지 확인합니다
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A controller_A_1 configured enabled heal roots completed cluster_B controller_B_1 configured enabled waiting for switchback recovery 2 entries were displayed.
-
모든 SVM에서 재동기화가 완료되었는지 확인합니다. 'MetroCluster vserver show'
-
복구 작업에 의해 수행되는 자동 LIF 마이그레이션이 'MetroCluster check lif show'에 성공적으로 완료되었는지 확인합니다
-
정상적인 클러스터에 있는 모든 노드에서 'MetroCluster 스위치백' 명령을 사용하여 스위치백을 수행합니다.
-
스위치백 작업이 완료되었는지 확인합니다. 'MetroCluster show'
클러스터가 "대기 중 - 스위치백" 상태에 있으면 스위치백 작업이 여전히 실행 중입니다.
cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured switchover Remote: cluster_A configured waiting-for-switchback
클러스터가 '정상' 상태에 있으면 스위치백 작업이 완료됩니다.
cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured normal Remote: cluster_A configured normal
스위치백을 완료하는 데 시간이 오래 걸리는 경우 MetroCluster config-replication resync resync-status show 명령을 사용하여 진행 중인 기준선의 상태를 확인할 수 있습니다.
-
SnapMirror 또는 SnapVault 구성을 다시 설정합니다.
6단계: 장애가 발생한 부품을 NetApp에 반환
키트와 함께 제공된 RMA 지침에 설명된 대로 오류가 발생한 부품을 NetApp에 반환합니다. "부품 반환 및 교체"자세한 내용은 페이지를 참조하십시오.