본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

DIMM-AFF A700 및 FAS9000을 교체합니다

시스템에서 수정 가능한 오류 수정 코드(ECC)를 계속 등록할 때 컨트롤러 모듈의 DIMM을 교체해야 합니다. 그렇지 않으면 시스템 패닉이 발생합니다.

시스템의 다른 모든 구성 요소가 올바르게 작동해야 합니다. 그렇지 않은 경우 기술 지원 부서에 문의해야 합니다.

오류가 발생한 구성 요소를 공급업체로부터 받은 교체 FRU 구성 요소로 교체해야 합니다.

1단계: 손상된 컨트롤러를 종료합니다

스토리지 시스템 하드웨어 구성에 따라 다른 절차를 사용하여 손상된 컨트롤러를 종료하거나 인수할 수 있습니다.

옵션 1: 대부분의 구성

손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공할 수 있도록 컨트롤러를 인수해야 합니다.

이 작업에 대해
  • NetApp 스토리지 암호화를 사용하는 경우_ONTAP 9 NetApp 암호화 전원 가이드 _ 의 "'SED를 보호되지 않는 모드로 복귀' 섹션에 나와 있는 지침에 따라 MSID를 재설정해야 합니다.

  • SAN 시스템을 사용하는 경우 손상된 컨트롤러 SCSI 블레이드의 이벤트 메시지('이벤트 로그 표시')를 확인해야 합니다.

    각 SCSI 블레이드 프로세스는 클러스터의 다른 노드와 함께 쿼럼에 있어야 합니다. 교체를 진행하기 전에 모든 문제를 해결해야 합니다.

  • 노드가 2개 이상인 클러스터가 있는 경우 쿼럼에 있어야 합니다. 클러스터가 쿼럼에 없거나 정상 컨트롤러에 자격 및 상태에 대해 FALSE가 표시되는 경우 손상된 컨트롤러를 종료하기 전에 문제를 해결해야 합니다. 을 참조하십시오 "CLI를 사용한 관리 개요".

  • MetroCluster 설정이 있는 경우 MetroCluster 설정 상태가 구성되어 있고 해당 노드가 설정 및 정상 상태('MetroCluster node show')인지 확인해야 합니다.

단계
  1. AutoSupport가 활성화된 경우 'system node AutoSupport invoke -node * -type all-message MAINT=number_of_hours_downh' AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다

    다음 AutoSupport 메시지는 두 시간 동안 자동 케이스 생성을 억제합니다: ' cluster1: * > system node AutoSupport invoke - node * -type all-message MAINT=2h'

  2. 정상적인 컨트롤러의 콘솔에서 'Storage failover modify – node local - auto-반환 false’를 자동으로 반환합니다

  3. 손상된 컨트롤러를 로더 프롬프트로 가져가십시오.

    손상된 컨트롤러가 표시되는 경우…​ 그러면…​

    LOADER 메시지가 표시됩니다

    컨트롤러 모듈 제거 로 이동합니다.

    반환 대기 중…​

    Ctrl-C를 누른 다음 메시지가 나타나면 y를 누릅니다.

    시스템 프롬프트 또는 암호 프롬프트(시스템 암호 입력)

    정상적인 컨트롤러 'storage failover takeover -ofnode_impaired_node_name_'에서 손상된 컨트롤러를 인수하거나 중단합니다

    손상된 컨트롤러에 기브백을 기다리는 중…​ 이 표시되면 Ctrl-C를 누른 다음 y를 응답합니다.

옵션 2: 컨트롤러가 2노드 MetroCluster에 있습니다

손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 컨트롤러 전원을 전환하여 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공하도록 해야 합니다.

이 작업에 대해
  • NetApp Storage Encryption을 사용하는 경우 의 "FIPS 드라이브 또는 SED를 보호되지 않는 모드로 되돌리기" 섹션의 지침에 따라 MSID를 재설정해야 합니다 "CLI를 통한 NetApp 암호화 개요".

  • 정상 컨트롤러에 전원을 공급하려면 이 절차의 마지막에 전원 공급 장치를 켜 두어야 합니다.

단계
  1. MetroCluster 상태를 확인하여 장애가 있는 컨트롤러가 자동으로 정상 컨트롤러(MetroCluster show)로 전환되었는지 확인합니다

  2. 자동 절체가 발생했는지 여부에 따라 다음 표에 따라 진행합니다.

    컨트롤러 손상 여부 그러면…​

    가 자동으로 전환되었습니다

    다음 단계를 진행합니다.

    가 자동으로 전환되지 않았습니다

    정상 컨트롤러 MetroCluster 절체 기능을 통해 계획된 절체 동작을 수행한다

    가 자동으로 전환되지 않고, 'MetroCluster switchover' 명령으로 전환을 시도했으며, 스위치오버가 거부되었습니다

    거부권 메시지를 검토하고 가능한 경우 문제를 해결한 후 다시 시도하십시오. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

  3. 정상적인 클러스터에서 'MetroCluster 환원 단계 집계' 명령을 실행하여 데이터 애그리게이트를 재동기화합니다.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    치유가 거부되면 '-override-vetoes' 매개 변수를 사용하여 'MetroCluster 환원' 명령을 재실행할 수 있습니다. 이 선택적 매개 변수를 사용하는 경우 시스템은 복구 작업을 방지하는 모든 소프트 베인을 재정의합니다.

  4. MetroCluster operation show 명령을 사용하여 작업이 완료되었는지 확인합니다.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 'storage aggregate show' 명령을 사용하여 애그리게이트의 상태를 확인하십시오.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. MetroCluster 환원 단계 루트 애그리게이트( heal-phase root-aggregate) 명령을 사용하여 루트 애그리게이트를 수정합니다.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    치유가 거부되면 -override-vetoes 매개변수를 사용하여 'MetroCluster 환원' 명령을 재실행할 수 있습니다. 이 선택적 매개 변수를 사용하는 경우 시스템은 복구 작업을 방지하는 모든 소프트 베인을 재정의합니다.

  7. 대상 클러스터에서 'MetroCluster operation show' 명령을 사용하여 환원 작업이 완료되었는지 확인합니다.

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 손상된 컨트롤러 모듈에서 전원 공급 장치를 분리합니다.

2단계: 컨트롤러 모듈을 분리합니다

컨트롤러 내의 구성 요소에 액세스하려면 먼저 시스템에서 컨트롤러 모듈을 분리한 다음 컨트롤러 모듈의 덮개를 분리해야 합니다.

단계
  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 손상된 컨트롤러 모듈에서 케이블을 뽑고 케이블이 연결된 위치를 추적합니다.

  3. 캠 핸들의 주황색 버튼을 잠금 해제할 때까지 아래로 밉니다.

    drw 9000을 사용하여 PCM을 제거합니다

    캠 핸들 해제 버튼

    캠 핸들

  4. 캠 핸들을 돌려 컨트롤러 모듈을 섀시에서 완전히 분리한 다음 컨트롤러 모듈을 섀시 밖으로 밉니다.

    컨트롤러 모듈 하단을 섀시 밖으로 밀어낼 때 지지하는지 확인합니다.

  5. 컨트롤러 모듈 덮개를 평평하고 안정적인 곳에 놓고 덮개의 파란색 단추를 누르고 덮개를 컨트롤러 모듈 뒤쪽으로 민 다음 덮개를 위로 돌려 컨트롤러 모듈에서 들어올립니다.

    drw 9000 PCM이 열려 있습니다

    컨트롤러 모듈 커버 잠금 버튼

3단계: DIMM을 교체합니다

DIMM을 교체하려면 컨트롤러 내부에서 DIMM을 찾은 후 특정 단계를 따르십시오.

단계
  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 컨트롤러 모듈에서 DIMM을 찾습니다.

    참고 각 시스템 메모리 DIMM에는 각 DIMM 슬롯 옆의 보드에 있는 LED가 있습니다. 결함이 있는 LED가 2초마다 깜박입니다.
    drw 9000 DIMM 맵
  3. DIMM의 양쪽에 있는 두 개의 DIMM 이젝터 탭을 천천히 밀어 슬롯에서 DIMM을 꺼낸 다음 슬롯에서 DIMM을 밀어 꺼냅니다.

    참고 DIMM 회로 보드의 구성 요소에 압력이 가해질 수 있으므로 DIMM의 가장자리를 조심스럽게 잡으십시오.
    DRW 9000이 PCM DIMM을 교체합니다

    DIMM 이젝터 탭

    DIMM

  4. 정전기 방지 포장용 백에서 교체용 DIMM을 제거하고 DIMM을 모서리에 맞춰 슬롯에 맞춥니다.

    DIMM의 핀 사이의 노치가 소켓의 탭과 일직선이 되어야 합니다.

  5. 커넥터의 DIMM 이젝터 탭이 열린 위치에 있는지 확인한 다음 DIMM을 슬롯에 똑바로 삽입합니다.

    DIMM은 슬롯에 단단히 장착되지만 쉽게 장착할 수 있습니다. 그렇지 않은 경우 DIMM을 슬롯에 재정렬하고 다시 삽입합니다.

    참고 DIMM이 균일하게 정렬되어 슬롯에 완전히 삽입되었는지 육안으로 검사합니다.
  6. 이젝터 탭이 DIMM 끝 부분의 노치 위에 끼워질 때까지 DIMM의 상단 가장자리를 조심스럽게 단단히 누릅니다.

  7. 컨트롤러 모듈 덮개를 닫습니다.

4단계: 컨트롤러를 설치합니다

컨트롤러 모듈에 구성 요소를 설치한 후에는 컨트롤러 모듈을 시스템 섀시에 다시 설치하고 운영 체제를 부팅해야 합니다.

동일한 섀시에 2개의 컨트롤러 모듈이 있는 HA 쌍의 경우, 컨트롤러 모듈을 설치하는 순서는 섀시에 완전히 장착되자마자 재부팅을 시도하기 때문에 특히 중요합니다.

단계
  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 아직 설치하지 않은 경우 컨트롤러 모듈의 덮개를 다시 끼우십시오.

  3. 컨트롤러 모듈의 끝을 섀시의 입구에 맞춘 다음 컨트롤러 모듈을 반쯤 조심스럽게 시스템에 밀어 넣습니다.

    참고 지시가 있을 때까지 컨트롤러 모듈을 섀시에 완전히 삽입하지 마십시오.
  4. 다음 섹션의 작업을 수행하기 위해 시스템에 액세스할 수 있도록 관리 포트와 콘솔 포트에만 케이블을 연결합니다.

    참고 이 절차의 뒷부분에서 나머지 케이블을 컨트롤러 모듈에 연결합니다.
  5. 컨트롤러 모듈 재설치를 완료합니다.

    1. 아직 설치하지 않은 경우 케이블 관리 장치를 다시 설치하십시오.

    2. 컨트롤러 모듈이 중앙판과 만나 완전히 장착될 때까지 섀시 안으로 단단히 밀어 넣습니다.

      컨트롤러 모듈이 완전히 장착되면 잠금 래치가 상승합니다.

      참고 커넥터가 손상되지 않도록 컨트롤러 모듈을 섀시에 밀어 넣을 때 과도한 힘을 가하지 마십시오.

    컨트롤러 모듈이 섀시에 완전히 장착되면 바로 부팅이 시작됩니다. 부트 프로세스를 중단할 준비를 하십시오.

    1. 잠금 래치를 위쪽으로 돌려 잠금 핀이 분리될 때까지 기울인 다음 잠금 위치로 내립니다.

    2. Press Ctrl-C for Boot Menu가 표시되면 Ctrl-C를 눌러 부팅 프로세스를 중단합니다.

    3. 표시된 메뉴에서 유지보수 모드로 부팅하는 옵션을 선택합니다.

5단계: 시스템 수준 진단 프로그램을 실행합니다

새 DIMM을 설치한 후 진단 유틸리티를 실행해야 합니다.

시스템 레벨 진단을 시작하려면 시스템에 LOADER 메시지가 표시되어야 합니다.

진단 절차의 모든 명령은 구성 요소를 교체하는 노드에서 실행됩니다.

단계
  1. 수리할 노드가 LOADER 프롬프트에 있지 않은 경우 다음 단계를 수행하십시오.

    1. 표시된 메뉴에서 유지보수 모드 옵션을 선택합니다.

    2. 노드가 유지보수 모드로 부팅된 후 노드 'halt’를 중지합니다

      명령을 실행한 후 시스템이 로더 프롬프트에서 중지될 때까지 기다려야 합니다.

      참고 부팅 프로세스 중에 프롬프트에 "y"로 안전하게 응답할 수 있습니다.
      • HA 구성에서 유지 관리 모드로 전환할 때 정상 상태의 노드가 계속 중지되어 있는지 확인해야 한다는 프롬프트 경고입니다.

  2. LOADER 프롬프트에서 시스템 수준 진단이 제대로 작동하도록 특별히 설계된 특수 드라이버('BOOT_DIAGS')에 액세스합니다

    부팅 프로세스 중에 유지보수 모드 프롬프트(*>)가 나타날 때까지 프롬프트에 "y"로 안전하게 응답할 수 있습니다.

  3. 시스템 메모리에 대해 'ldiag device run-dev mpem’이라는 진단 유틸리티를 실행합니다

  4. DIMM의 교체로 인한 하드웨어 문제가 없는지 확인합니다. 'ldiag device status - dev mpm -long-state failed'

    시스템 수준 진단은 테스트 실패가 없을 경우 프롬프트로 돌아가거나 구성 요소 테스트로 인한 전체 실패 상태를 표시합니다.

  5. 이전 단계의 결과에 따라 계속 진행합니다.

    시스템 수준 진단이 테스트되는 경우…​ 그러면…​

    실패없이 완료되었습니다

    1. 상태 로그 'ldiag device clearstatus’를 지웁니다

    2. 'ldiag device status’라는 로그가 지워졌는지 확인한다

      다음과 같은 기본 응답이 표시됩니다.

    _SLDIAG: 로그 메시지가 없습니다. _

    1. 유지보수 모드를 종료합니다

      노드에 LOADER 프롬프트가 표시됩니다.

    2. LOADER 프롬프트에서 bye 노드를 부팅합니다

    3. 노드를 정상 작동 상태로 되돌립니다.

    HA 쌍

    'storage failover 반환 - ofnode_replacement_node_name_'을 제공합니다

    참고 자동 반환 기능을 해제한 경우 스토리지 페일오버 수정 명령으로 다시 사용하도록 설정하십시오.

    2노드 MetroCluster 구성

    다음 단계를 진행합니다.

    MetroCluster 스위치백 절차는 교체 프로세스의 다음 작업에서 수행됩니다.

    독립형 구성

    다음 단계를 진행합니다.

    별도의 조치가 필요하지 않습니다.

    시스템 수준 진단을 완료했습니다.

    테스트 실패가 발생했습니다

    문제의 원인을 확인합니다.

    1. 유지보수 모드를 종료합니다

      명령을 실행한 후 LOADER 프롬프트에서 시스템이 중지될 때까지 기다립니다.

    2. 섀시에 있는 컨트롤러 모듈 수에 따라 전원 공급 장치를 끄거나 켜 둡니다.

      • 섀시에 두 개의 컨트롤러 모듈이 있는 경우 다른 컨트롤러 모듈에 전원을 공급하려면 전원 공급 장치를 켜 두십시오.

      • 섀시에 하나의 컨트롤러 모듈이 있는 경우 전원 공급 장치를 끄고 전원에서 분리합니다.

    3. 시스템 수준 진단 프로그램 실행 시 확인된 모든 고려 사항, 케이블이 안전하게 연결되어 있는지, 하드웨어 구성 요소가 스토리지 시스템에 올바르게 설치되어 있는지 확인합니다.

    4. 부팅 메뉴에 대한 메시지가 표시되면 'Ctrl-C’를 눌러 현재 사용 중인 컨트롤러 모듈을 부팅하고 부팅을 중단하십시오.

      • 섀시에 2개의 컨트롤러 모듈이 있는 경우, 서비스 중인 컨트롤러 모듈을 섀시에 완전히 장착합니다.

        컨트롤러 모듈이 완전히 장착되면 부팅됩니다.

      • 섀시에 하나의 컨트롤러 모듈이 있는 경우 전원 공급 장치를 연결한 다음 전원을 켭니다.

    5. 메뉴에서 Boot to maintenance mode(유지 관리 모드로 부팅) 를 선택합니다.

    6. 'halt' 명령어를 입력하여 Maintenance Mode를 종료한다

      명령을 실행한 후 LOADER 프롬프트에서 시스템이 중지될 때까지 기다립니다.

    7. 시스템 레벨 진단 테스트를 다시 실행하십시오.

6단계: 2노드 MetroCluster 구성에서 애그리게이트를 다시 전환합니다

2노드 MetroCluster 구성에서 FRU 교체를 완료한 후에는 MetroCluster 스위치백 작업을 수행할 수 있습니다. 그러면 이전 사이트의 SVM(Sync-Source Storage Virtual Machine)이 활성 상태이고 로컬 디스크 풀에서 데이터를 제공하는 구성을 정상 운영 상태로 되돌릴 수 있습니다.

이 작업은 2노드 MetroCluster 구성에만 적용됩니다.

단계
  1. 모든 노드가 "enabled" 상태(MetroCluster node show)에 있는지 확인합니다

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. 모든 SVM에서 재동기화가 완료되었는지 확인합니다. 'MetroCluster vserver show'

  3. 복구 작업에 의해 수행되는 자동 LIF 마이그레이션이 'MetroCluster check lif show’에 성공적으로 완료되었는지 확인합니다

  4. 정상적인 클러스터에 있는 모든 노드에서 'MetroCluster 스위치백' 명령을 사용하여 스위치백을 수행합니다.

  5. 스위치백 작업이 완료되었는지 확인합니다. 'MetroCluster show'

    클러스터가 "대기 중 - 스위치백" 상태에 있으면 스위치백 작업이 여전히 실행 중입니다.

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    클러스터가 '정상' 상태에 있으면 스위치백 작업이 완료됩니다.

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    스위치백을 완료하는 데 시간이 오래 걸리는 경우 MetroCluster config-replication resync resync-status show 명령을 사용하여 진행 중인 기준선의 상태를 확인할 수 있습니다.

  6. SnapMirror 또는 SnapVault 구성을 다시 설정합니다.

7단계: 장애가 발생한 부품을 NetApp에 반환

키트와 함께 제공된 RMA 지침에 설명된 대로 오류가 발생한 부품을 NetApp에 반환합니다. 를 참조하십시오 "부품 반품 및 앰프, 교체" 페이지를 참조하십시오.