본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

DIMM-AFF A900을 교체합니다

시스템에서 수정 가능한 오류 수정 코드(ECC)를 계속 등록할 때 컨트롤러 모듈의 DIMM을 교체해야 합니다. 그렇지 않으면 시스템 패닉이 발생합니다.

시스템의 다른 모든 구성 요소가 올바르게 작동해야 합니다. 그렇지 않은 경우 기술 지원 부서에 문의해야 합니다.

오류가 발생한 구성 요소를 공급업체로부터 받은 교체 FRU 구성 요소로 교체해야 합니다.

1단계: 손상된 컨트롤러를 종료합니다

다음 옵션 중 하나를 사용하여 컨트롤러를 종료하거나 손상된 컨트롤러를 인수합니다.

옵션 1: 대부분의 시스템

손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공할 수 있도록 컨트롤러를 인수해야 합니다.

이 작업에 대해
  • NetApp 스토리지 암호화를 사용하는 경우_ONTAP 9 NetApp 암호화 전원 가이드 _ 의 "'SED를 보호되지 않는 모드로 복귀' 섹션에 나와 있는 지침에 따라 MSID를 재설정해야 합니다.

  • SAN 시스템을 사용하는 경우 손상된 컨트롤러 SCSI 블레이드의 이벤트 메시지('이벤트 로그 표시')를 확인해야 합니다.

    각 SCSI 블레이드 프로세스는 클러스터의 다른 노드와 함께 쿼럼에 있어야 합니다. 교체를 진행하기 전에 모든 문제를 해결해야 합니다.

  • 노드가 2개 이상인 클러스터가 있는 경우 쿼럼에 있어야 합니다. 클러스터가 쿼럼에 없거나 정상 컨트롤러에 자격 및 상태에 대해 FALSE가 표시되는 경우 손상된 컨트롤러를 종료하기 전에 문제를 해결해야 합니다. 을 참조하십시오 "CLI를 사용한 관리 개요".

  • MetroCluster 설정이 있는 경우 MetroCluster 설정 상태가 구성되어 있고 해당 노드가 설정 및 정상 상태('MetroCluster node show')인지 확인해야 합니다.

단계
  1. AutoSupport가 활성화된 경우 'system node AutoSupport invoke -node * -type all-message MAINT=number_of_hours_downh' AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다

    다음 AutoSupport 메시지는 두 시간 동안 자동 케이스 생성을 억제합니다: ' cluster1: * > system node AutoSupport invoke - node * -type all-message MAINT=2h'

  2. 정상적인 컨트롤러의 콘솔에서 'Storage failover modify – node local - auto-반환 false’를 자동으로 반환합니다

  3. 손상된 컨트롤러를 로더 프롬프트로 가져가십시오.

    손상된 컨트롤러가 표시되는 경우…​ 그러면…​

    LOADER 메시지가 표시됩니다

    컨트롤러 모듈 제거 로 이동합니다.

    반환 대기 중…​

    Ctrl-C를 누른 다음 메시지가 나타나면 y를 누릅니다.

    시스템 프롬프트 또는 암호 프롬프트(시스템 암호 입력)

    정상적인 컨트롤러 'storage failover takeover -ofnode_impaired_node_name_'에서 손상된 컨트롤러를 인수하거나 중단합니다

    손상된 컨트롤러에 기브백을 기다리는 중…​ 이 표시되면 Ctrl-C를 누른 다음 y를 응답합니다.

옵션 2: 컨트롤러가 MetroCluster에 있습니다
참고 시스템이 2노드 MetroCluster 구성인 경우 이 절차를 사용하지 마십시오.

손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공할 수 있도록 컨트롤러를 인수해야 합니다.

  • 노드가 2개 이상인 클러스터가 있는 경우 쿼럼에 있어야 합니다. 클러스터가 쿼럼에 없거나 정상 컨트롤러에 자격 및 상태에 대해 FALSE가 표시되는 경우 손상된 컨트롤러를 종료하기 전에 문제를 해결해야 합니다. 을 참조하십시오 "CLI를 사용한 관리 개요".

  • MetroCluster 설정이 있는 경우 MetroCluster 설정 상태가 구성되어 있고 해당 노드가 설정 및 정상 상태('MetroCluster node show')인지 확인해야 합니다.

단계
  1. AutoSupport가 활성화된 경우 'system node AutoSupport invoke -node * -type all-message MAINT=number_of_hours_downh' AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다

    다음 AutoSupport 메시지는 두 시간 동안 자동 케이스 생성을 억제합니다: ' cluster1: * > system node AutoSupport invoke - node * -type all-message MAINT=2h'

  2. 정상적인 컨트롤러의 콘솔에서 'Storage failover modify – node local - auto-반환 false’를 자동으로 반환합니다

  3. 손상된 컨트롤러를 로더 프롬프트로 가져가십시오.

    손상된 컨트롤러가 표시되는 경우…​ 그러면…​

    LOADER 메시지가 표시됩니다

    컨트롤러 모듈 제거 로 이동합니다.

    반환 대기 중…​

    Ctrl-C를 누른 다음 메시지가 나타나면 y를 누릅니다.

    시스템 프롬프트 또는 암호 프롬프트(시스템 암호 입력)

    정상적인 컨트롤러 'storage failover takeover -ofnode_impaired_node_name_'에서 손상된 컨트롤러를 인수하거나 중단합니다

    손상된 컨트롤러에 기브백을 기다리는 중…​ 이 표시되면 Ctrl-C를 누른 다음 y를 응답합니다.

2단계: 컨트롤러 모듈을 분리합니다

컨트롤러 내의 구성 요소에 액세스하려면 먼저 시스템에서 컨트롤러 모듈을 분리한 다음 컨트롤러 모듈의 덮개를 분리해야 합니다.

  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 손상된 컨트롤러 모듈에서 케이블을 뽑고 케이블이 연결된 위치를 추적합니다.

  3. 캠 핸들의 테라코타 버튼이 잠금 해제될 때까지 아래로 밉니다.

    drw a900 PCM을 제거합니다

    캠 핸들 해제 버튼

    캠 핸들

  4. 캠 핸들을 돌려 컨트롤러 모듈을 섀시에서 완전히 분리한 다음 컨트롤러 모듈을 섀시 밖으로 밉니다.

    컨트롤러 모듈 하단을 섀시 밖으로 밀어낼 때 지지하는지 확인합니다.

  5. 컨트롤러 모듈 덮개를 평평하고 안정적인 곳에 놓고 덮개의 파란색 단추를 누르고 덮개를 컨트롤러 모듈 뒤쪽으로 민 다음 덮개를 위로 돌려 컨트롤러 모듈에서 들어올립니다.

    drw a900 PCM이 열려 있습니다

    컨트롤러 모듈 커버 잠금 버튼

3단계: DIMM을 교체합니다

DIMM을 교체하려면 컨트롤러 내부에서 DIMM을 찾은 후 특정 단계를 따르십시오.

  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 컨트롤러 모듈에서 DIMM을 찾습니다.

    참고 각 시스템 메모리 DIMM에는 각 DIMM 슬롯 옆의 보드에 있는 LED가 있습니다. 결함이 있는 LED가 2초마다 깜박입니다.
    drw a900 DIMM 맵
  3. DIMM의 양쪽에 있는 두 개의 DIMM 이젝터 탭을 천천히 밀어 슬롯에서 DIMM을 꺼낸 다음 슬롯에서 DIMM을 밀어 꺼냅니다.

    중요 DIMM 회로 보드의 구성 요소에 압력이 가해질 수 있으므로 DIMM의 가장자리를 조심스럽게 잡으십시오.
    drw a900 PCM DIMM을 교체합니다

    DIMM 이젝터 탭

    DIMM

  4. 정전기 방지 포장용 백에서 교체용 DIMM을 제거하고 DIMM을 모서리에 맞춰 슬롯에 맞춥니다.

    DIMM의 핀 사이의 노치가 소켓의 탭과 일직선이 되어야 합니다.

  5. 커넥터의 DIMM 이젝터 탭이 열린 위치에 있는지 확인한 다음 DIMM을 슬롯에 똑바로 삽입합니다.

    DIMM은 슬롯에 단단히 장착되지만 쉽게 장착할 수 있습니다. 그렇지 않은 경우 DIMM을 슬롯에 재정렬하고 다시 삽입합니다.

    중요 DIMM이 균일하게 정렬되어 슬롯에 완전히 삽입되었는지 육안으로 검사합니다.
  6. 이젝터 탭이 DIMM 끝 부분의 노치 위에 끼워질 때까지 DIMM의 상단 가장자리를 조심스럽게 단단히 누릅니다.

  7. 컨트롤러 모듈 덮개를 닫습니다.

4단계: 컨트롤러를 설치합니다

컨트롤러 모듈에 구성 요소를 설치한 후에는 컨트롤러 모듈을 시스템 섀시에 다시 설치하고 운영 체제를 부팅해야 합니다.

동일한 섀시에 2개의 컨트롤러 모듈이 있는 HA 쌍의 경우, 컨트롤러 모듈을 설치하는 순서는 섀시에 완전히 장착되자마자 재부팅을 시도하기 때문에 특히 중요합니다.

  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 아직 설치하지 않은 경우 컨트롤러 모듈의 덮개를 다시 끼우십시오.

    drw a900 PCM이 열려 있습니다

    컨트롤러 모듈 커버 잠금 버튼

  3. 컨트롤러 모듈의 끝을 섀시의 입구에 맞춘 다음 컨트롤러 모듈을 반쯤 조심스럽게 시스템에 밀어 넣습니다.

    drw a900 PCM을 제거합니다

    캠 핸들 해제 버튼

    캠 핸들

    참고 지시가 있을 때까지 컨트롤러 모듈을 섀시에 완전히 삽입하지 마십시오.
  4. 다음 섹션의 작업을 수행하기 위해 시스템에 액세스할 수 있도록 관리 포트와 콘솔 포트에만 케이블을 연결합니다.

    참고 이 절차의 뒷부분에서 나머지 케이블을 컨트롤러 모듈에 연결합니다.
  5. 컨트롤러 모듈 재설치를 완료합니다.

    1. 아직 설치하지 않은 경우 케이블 관리 장치를 다시 설치하십시오.

    2. 컨트롤러 모듈이 중앙판과 만나 완전히 장착될 때까지 섀시 안으로 단단히 밀어 넣습니다.

      컨트롤러 모듈이 완전히 장착되면 잠금 래치가 상승합니다.

      중요 커넥터가 손상되지 않도록 컨트롤러 모듈을 섀시에 밀어 넣을 때 과도한 힘을 가하지 마십시오.

    컨트롤러 모듈이 섀시에 완전히 장착되면 바로 부팅이 시작됩니다. 부트 프로세스를 중단할 준비를 하십시오.

    1. 잠금 래치를 위쪽으로 돌려 잠금 핀이 분리될 때까지 기울인 다음 잠금 위치로 내립니다.

    2. Press Ctrl-C for Boot Menu가 표시되면 Ctrl-C를 눌러 부팅 프로세스를 중단합니다.

    3. 표시된 메뉴에서 유지보수 모드로 부팅하는 옵션을 선택합니다.

5단계: 시스템 수준 진단 프로그램을 실행합니다

새 DIMM을 설치한 후 진단 유틸리티를 실행해야 합니다.

시스템 레벨 진단을 시작하려면 시스템에 LOADER 메시지가 표시되어야 합니다.

진단 절차의 모든 명령은 구성 요소를 교체하는 컨트롤러에서 실행됩니다.

  1. 수리할 컨트롤러가 로더 프롬프트에 있지 않은 경우 다음 단계를 수행하십시오.

    1. 표시된 메뉴에서 유지보수 모드 옵션을 선택합니다.

    2. 컨트롤러가 유지보수 모드로 부팅된 후 컨트롤러를 정지시킵니다

      명령을 실행한 후 시스템이 로더 프롬프트에서 중지될 때까지 기다려야 합니다.

      중요 부팅 과정 중에 메시지에 안전하게 'y’로 응답할 수 있습니다.
      • HA 구성에서 유지보수 모드로 전환할 때 정상 상태의 컨트롤러가 계속 중지되는지 확인하는 경고 메시지가 표시되는 경우

  2. LOADER 프롬프트에서 시스템 수준 진단이 제대로 작동하도록 특별히 설계된 특수 드라이버('BOOT_DIAGS')에 액세스합니다

    부팅 프로세스 중에 유지보수 모드 프롬프트(*>)가 나타날 때까지 프롬프트에 "y"로 안전하게 응답할 수 있습니다.

  3. 시스템 메모리에 대해 'ldiag device run-dev mpem’이라는 진단 유틸리티를 실행합니다

  4. DIMM의 교체로 인한 하드웨어 문제가 없는지 확인합니다. 'ldiag device status - dev mpm -long-state failed'

    시스템 수준 진단은 테스트 실패가 없을 경우 프롬프트로 돌아가거나 구성 요소 테스트로 인한 전체 실패 상태를 표시합니다.

  5. 이전 단계의 결과에 따라 계속 진행합니다.

    시스템 수준 진단이 테스트되는 경우…​ 그러면…​

    실패없이 완료되었습니다

    1. 상태 로그 'ldiag device clearstatus’를 지웁니다

    2. 'ldiag device status’라는 로그가 지워졌는지 확인한다

      다음과 같은 기본 응답이 표시됩니다.

      SLDIAG: 로그 메시지가 없습니다.

    3. 유지보수 모드를 종료합니다

      컨트롤러에 LOADER 프롬프트가 표시됩니다.

    4. LOADER 프롬프트에서 컨트롤러를 부팅합니다. bye

    5. 컨트롤러를 정상 작동 상태로 되돌립니다.

    컨트롤러가 다음 상태인 경우: 그러면…​

    HA 쌍

    'storage failover 반환 - ofnode replacement_node_name' * 참고: * 자동 반환을 해제한 경우 스토리지 페일오버 수정 명령을 사용하여 다시 설정하십시오.

    테스트 실패가 발생했습니다

    문제의 원인을 확인합니다.

    1. 유지보수 모드를 종료합니다

      명령을 실행한 후 LOADER 프롬프트에서 시스템이 중지될 때까지 기다립니다.

    2. 시스템 수준 진단 프로그램 실행 시 확인된 모든 고려 사항, 케이블이 안전하게 연결되어 있는지, 하드웨어 구성 요소가 스토리지 시스템에 올바르게 설치되어 있는지 확인합니다.

    3. 부팅 메뉴에 대한 메시지가 표시되면 'Ctrl-C’를 눌러 현재 사용 중인 컨트롤러 모듈을 부팅하고 부팅을 중단하십시오.

      • 섀시에 2개의 컨트롤러 모듈이 있는 경우, 서비스 중인 컨트롤러 모듈을 섀시에 완전히 장착합니다.

        컨트롤러 모듈이 완전히 장착되면 부팅됩니다.

      • 섀시에 하나의 컨트롤러 모듈이 있는 경우 전원 공급 장치를 연결한 다음 전원을 켭니다.

    4. 메뉴에서 Boot to maintenance mode(유지 관리 모드로 부팅) 를 선택합니다.

    5. 'halt' 명령어를 입력하여 Maintenance Mode를 종료한다

      명령을 실행한 후 LOADER 프롬프트에서 시스템이 중지될 때까지 기다립니다.

    6. 시스템 레벨 진단 테스트를 다시 실행하십시오.

6단계: 장애가 발생한 부품을 NetApp에 반환

키트와 함께 제공된 RMA 지침에 설명된 대로 오류가 발생한 부품을 NetApp에 반환합니다. 를 참조하십시오 "부품 반품 및 앰프, 교체" 페이지를 참조하십시오.