Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

DIMM-AFF A800을 교체합니다

기여자 dougthomp Copilot

AFF A800 시스템에서 수정 가능하거나 수정 불가능한 메모리 오류가 과도하게 감지되면 DIMM을 교체하십시오. 이러한 오류로 인해 스토리지 시스템이 ONTAP 부팅하지 못할 수 있습니다. 교체 프로세스에는 손상된 컨트롤러를 종료하고, 제거하고, DIMM을 교체하고, 컨트롤러를 다시 설치한 다음, 오류가 발생한 부품을 NetApp 으로 반환하는 작업이 포함됩니다.

시작하기 전에
  • 시스템의 다른 모든 구성 요소가 제대로 작동하는지 확인하십시오. 그렇지 않은 경우 기술 지원 부서에 문의해야 합니다.

  • 장애가 발생한 구성 요소를 NetApp로부터 받은 교체 구성 요소로 교체해야 합니다.

1단계: 손상된 컨트롤러를 종료합니다

고장난 컨트롤러를 종료하거나 제어권을 넘겨받으세요.

손상된 컨트롤러를 종료하려면 컨트롤러 상태를 확인하고, 필요한 경우 정상적인 컨트롤러가 손상된 컨트롤러 스토리지에서 데이터를 계속 제공할 수 있도록 컨트롤러를 인수해야 합니다.

이 작업에 대해
  • SAN 시스템을 사용하는 경우 손상된 컨트롤러 SCSI 블레이드에 대한 이벤트 메시지를 확인해야 cluster kernel-service show`합니다. priv advanced 모드에서 명령을 실행하면 `cluster kernel-service show 해당 노드의 노드 이름"쿼럼 상태입니다", 해당 노드의 가용성 상태 및 해당 노드의 작동 상태가 표시됩니다.

    각 SCSI 블레이드 프로세스는 클러스터의 다른 노드와 함께 쿼럼에 있어야 합니다. 교체를 진행하기 전에 모든 문제를 해결해야 합니다.

  • 노드가 2개 이상인 클러스터가 있는 경우 쿼럼에 있어야 합니다. 클러스터가 쿼럼에 없거나 정상 컨트롤러에 자격 및 상태에 대해 FALSE가 표시되는 경우 손상된 컨트롤러를 종료하기 전에 문제를 해결해야 합니다(참조) "노드를 클러스터와 동기화합니다".

단계
  1. AutoSupport가 활성화된 경우 AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다.

    system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    다음 AutoSupport 메시지는 2시간 동안 자동 케이스 생성을 억제합니다.

    cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 자동 환불 비활성화:

    1. 정상 컨트롤러의 콘솔에서 다음 명령을 입력하세요.

      storage failover modify -node impaired_node_name -auto-giveback false

    2. 입력하다 y _자동 환불을 비활성화하시겠습니까?_라는 메시지가 표시되면

  3. 손상된 컨트롤러를 로더 프롬프트로 가져가십시오.

    손상된 컨트롤러가 표시되는 경우…​ 그러면…​

    LOADER 메시지가 표시됩니다

    다음 단계로 이동합니다.

    반환 대기 중…​

    Ctrl-C를 누른 다음 메시지가 나타나면 y를 누릅니다.

    시스템 프롬프트 또는 암호 프롬프트

    정상적인 컨트롤러에서 손상된 컨트롤러를 인계하거나 중지합니다.

    storage failover takeover -ofnode impaired_node_name -halt true

    _-halt true_parameter는 Loader 프롬프트를 표시합니다.

2단계: 컨트롤러 모듈을 분리합니다

컨트롤러 모듈을 교체하거나 컨트롤러 모듈 내부에 있는 구성요소를 교체할 때 섀시에서 컨트롤러 모듈을 분리해야 합니다.

단계
  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 섀시의 모든 드라이브가 중앙판에 단단히 장착되어 있는지 확인합니다. 엄지 손가락으로 각 드라이브를 눌러 멈춤 상태가 될 때까지 누릅니다.

    영상 - 운전석 확인
    운전석에 앉으세요
  3. 시스템 상태에 따라 컨트롤러 드라이브를 점검하십시오.

    1. 정상적인 컨트롤러에서 활성 RAID 그룹 중 성능 저하 상태, 실패 상태 또는 둘 다에 해당하는 그룹이 있는지 확인하십시오.

      storage aggregate show -raidstatus !*normal*
    2. 파일 시스템 또는 예비 드라이브 모두에서 누락된 드라이브 문제를 확인합니다.

      event log show -severity * -node * -message-name *disk.missing*
      • 명령이 반환되면 There are no entries matching your query. 계속하세요다음 단계로 이동 .

      • 명령 실행 결과가 다르게 나오는 경우, 두 컨트롤러에서 AutoSupport 데이터를 수집하여 NetApp 지원팀에 문의하여 추가 지원을 받으십시오.

        system node autosupport invoke -node * -type all -message '<message_name>'
  4. [[전원 케이블 제거]]전원 케이블 고정 장치를 제거한 다음 전원 공급 장치에서 케이블을 뽑으세요.

  5. 케이블 정리 장치의 벨크로 스트랩을 느슨하게 하세요. 컨트롤러 모듈에서 시스템 케이블과 SFP/QSFP 모듈(필요한 경우)을 분리하십시오. 각 케이블의 위치를 기록해 두세요.

    케이블 관리 장치에 케이블을 남겨 두면 케이블 관리 장치를 다시 설치할 때 케이블이 정리됩니다.

  6. 컨트롤러 모듈에서 케이블 관리 장치를 분리하여 한쪽에 둡니다.

  7. 양쪽 잠금 래치를 아래로 누른 다음 두 래치를 동시에 아래로 돌립니다.

    컨트롤러 모듈이 섀시에서 약간 꺼냅니다.

    컨트롤러 모듈 분리

    설명선 번호 1

    잠금 래치

    설명선 번호 2

    잠금 핀

  8. 컨트롤러 모듈을 섀시 밖으로 밀어내고 안정적이고 평평한 표면에 놓습니다.

    컨트롤러 모듈의 하단을 받쳐준 후 섀시에서 빼내십시오.

3단계: DIMM를 교체합니다

컨트롤러의 DIMM을 교체하십시오.

DIMM을 교체하려면 공기 덕트 상단의 DIMM 맵 레이블을 사용하여 컨트롤러 모듈에서 DIMM을 찾은 다음 특정 순서에 따라 교체해야 합니다.

  1. 에어 덕트를 엽니다.

    1. 에어 덕트 측면에 있는 잠금 탭을 컨트롤러 모듈 중앙을 향해 누릅니다.

    2. 공기 덕트를 팬 모듈 쪽으로 민 다음 완전히 열린 위치까지 위쪽으로 돌립니다.

  2. DIMM을 분리할 때 해당 라이저에서 잠금 래치를 푼 다음 라이저를 분리합니다.

    DIMM을 교체합니다

    설명선 번호 1

    에어 덕트 커버

    설명선 번호 2

    라이저 1 및 DIMM 뱅크 1 및 3-6

    라이저 2 및 DIMM 뱅크 7-10, 12-13 및 15-18

    라이저 3 및 DIMM 19-22 및 24

    • 참고: * 슬롯 2와 14는 비어 있습니다. 이 슬롯에 DIMM을 설치하지 마십시오.

  3. 교체 DIMM을 올바른 방향으로 삽입할 수 있도록 소켓에서 DIMM의 방향을 기록해 두십시오.

  4. DIMM의 양쪽에 있는 두 개의 DIMM 이젝터 탭을 천천히 밀어 슬롯에서 DIMM을 꺼낸 다음 슬롯에서 DIMM을 밀어 꺼냅니다.

    참고 DIMM 회로 보드의 구성 요소에 압력이 가해질 수 있으므로 DIMM의 가장자리를 조심스럽게 잡으십시오.
  5. 정전기 방지 포장용 백에서 교체용 DIMM을 제거하고 DIMM을 모서리에 맞춰 슬롯에 맞춥니다.

    DIMM의 핀 사이의 노치가 소켓의 탭과 일직선이 되어야 합니다.

  6. DIMM을 슬롯에 똑바로 삽입합니다.

    DIMM은 슬롯에 단단히 장착되지만 쉽게 장착할 수 있습니다. 그렇지 않은 경우 DIMM을 슬롯에 재정렬하고 다시 삽입합니다.

    참고 DIMM이 균일하게 정렬되어 슬롯에 완전히 삽입되었는지 육안으로 검사합니다.
  7. 이젝터 탭이 DIMM 끝 부분의 노치 위에 끼워질 때까지 DIMM의 상단 가장자리를 조심스럽게 단단히 누릅니다.

  8. 컨트롤러 모듈에서 분리한 라이저를 모두 재설치합니다.

  9. 에어 덕트를 닫습니다.

4단계: 컨트롤러 모듈을 재설치합니다

컨트롤러 모듈을 다시 설치하고 재부팅합니다.

단계
  1. 컨트롤러 모듈의 끝을 섀시의 입구에 맞춘 다음 컨트롤러 모듈을 반쯤 조심스럽게 시스템에 밀어 넣습니다.

    참고 지시가 있을 때까지 컨트롤러 모듈을 섀시에 완전히 삽입하지 마십시오.
  2. 필요에 따라 시스템을 다시 연결합니다.

    미디어 컨버터(QSFP 또는 SFP)를 분리한 경우 광섬유 케이블을 사용하는 경우 다시 설치해야 합니다.

  3. 컨트롤러 모듈 재설치를 완료합니다.

    1. 컨트롤러 모듈이 중앙판과 만나 완전히 장착될 때까지 섀시 안으로 단단히 밀어 넣습니다.

      컨트롤러 모듈이 완전히 장착되면 잠금 래치가 상승합니다.

    참고 커넥터가 손상되지 않도록 컨트롤러 모듈을 섀시에 밀어 넣을 때 과도한 힘을 가하지 마십시오.
    1. 잠금 래치를 위쪽으로 돌려 잠금 핀이 분리될 때까지 기울인 다음 잠금 위치로 내립니다.

    2. 전원 코드를 전원 공급 장치에 연결하고 전원 케이블 잠금 칼러를 다시 설치한 다음 전원 공급 장치를 전원에 연결합니다.

      전원이 복구되는 즉시 컨트롤러 모듈이 부팅되기 시작합니다. 부트 프로세스를 중단할 준비를 하십시오.

    3. 아직 설치하지 않은 경우 케이블 관리 장치를 다시 설치하십시오.

  4. 손상된 컨트롤러를 다시 설치하여 정상 작동으로 되돌립니다.

    storage failover giveback -ofnode impaired_node_name..

  5. 자동 반환이 비활성화된 경우 다시 활성화하십시오.

    storage failover modify -node local -auto-giveback true..

  6. AutoSupport가 활성화된 경우 자동 케이스 생성을 복원/억제 해제:

    system node autosupport invoke -node * -type all -message MAINT=END..

5단계: 장애가 발생한 부품을 NetApp에 반환

키트와 함께 제공된 RMA 지침에 설명된 대로 오류가 발생한 부품을 NetApp에 반환합니다. "부품 반환 및 교체"자세한 내용은 페이지를 참조하십시오.