Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

I/O 모듈 핫 스왑 - AFF C80

기여자 dougthomp

모듈에 오류가 발생하고 스토리지 시스템이 모든 ONTAP 버전 요구 사항을 충족하는 경우 AFF C80 스토리지 시스템에서 이더넷 I/O 모듈을 핫 스왑할 수 있습니다.

I/O 모듈을 핫 스왑하려면 스토리지 시스템이 ONTAP 9.18.1 GA 이상을 실행 중인지 확인하고, 스토리지 시스템과 I/O 모듈을 준비한 다음, 장애가 발생한 모듈을 핫 스왑하고, 교체 모듈을 온라인 상태로 전환하고, 스토리지 시스템을 정상 작동 상태로 복원한 후 장애가 발생한 모듈을 NetApp에 반환합니다.

이 작업에 대해
  • 장애가 발생한 I/O 모듈을 교체하기 전에 수동 테이크오버를 수행할 필요가 없습니다.

  • 핫 스왑 중에 올바른 컨트롤러와 I/O 슬롯에 명령을 적용하십시오.

    • _손상된 컨트롤러_는 I/O 모듈을 교체하는 컨트롤러입니다.

    • 건강한 컨트롤러는 손상된 컨트롤러의 HA 파트너입니다.

  • 영향을 받는 스토리지 시스템을 물리적으로 찾는 데 도움이 되도록 스토리지 시스템 위치(파란색) LED를 켤 수 있습니다. SSH를 사용하여 BMC에 로그인하고 system location-led on 명령을 입력하십시오.

    스토리지 시스템에는 위치 표시 LED가 세 개 포함되어 있습니다. 하나는 작업자 표시 패널에 있고 나머지 하나는 각 컨트롤러에 있습니다. LED는 30분 동안 켜져 있습니다.

    명령을 입력하여 이러한 기능을 해제할 수 system location-led off 있습니다. LED가 켜져 있는지 또는 꺼져 있는지 확실하지 않은 경우 명령을 입력하여 LED의 상태를 확인할 수 system location-led show 있습니다.

1단계: 스토리지 시스템이 절차 요구 사항을 충족하는지 확인하십시오.

이 절차를 사용하려면 스토리지 시스템에서 ONTAP 9.18.1 GA 이상을 실행하고 있어야 하며 스토리지 시스템이 모든 요구 사항을 충족해야 합니다.

참고 스토리지 시스템이 ONTAP 9.18.1 GA 이상을 실행하고 있지 않은 경우 이 절차를 사용할 수 없으며 "I/O 모듈 교체 절차"을 사용해야 합니다.
  • 클러스터, HA 및 클라이언트에 사용되는 포트 조합에 관계없이 모든 슬롯에서 이더넷 I/O 모듈을 동등한 I/O 모듈로 핫 스왑할 수 있습니다. I/O 모듈 유형은 변경할 수 없습니다.

    스토리지 또는 MetroCluster에 사용되는 포트가 있는 Ethernet I/O 모듈은 핫 스왑을 지원하지 않습니다.

  • 스토리지 시스템(스위치리스 또는 스위치드 클러스터 구성)에는 스토리지 시스템에 대해 지원되는 수의 노드가 있을 수 있습니다.

  • 클러스터의 모든 노드는 동일한 ONTAP 버전(ONTAP 9.18.1GA 이상)을 실행하거나 동일한 ONTAP 버전의 서로 다른 패치 레벨을 실행해야 합니다.

    클러스터의 노드가 서로 다른 ONTAP 버전을 실행하는 경우 혼합 버전 클러스터로 간주되며 I/O 모듈 핫 스왑은 지원되지 않습니다.

  • 스토리지 시스템의 컨트롤러는 다음 두 가지 상태 중 하나일 수 있습니다.

    • 두 컨트롤러 모두 I/O(데이터 제공)를 실행할 수 있습니다.

    • I/O 모듈 장애로 인해 테이크오버가 발생했고 노드가 정상적으로 작동하는 경우 두 컨트롤러 중 하나가 테이크오버 상태에 있을 수 있습니다.

      특정 상황에서 ONTAP은 장애가 발생한 I/O 모듈로 인해 두 컨트롤러 중 하나를 자동으로 테이크오버할 수 있습니다. 예를 들어, 장애가 발생한 I/O 모듈에 모든 클러스터 포트가 포함되어 있는 경우(해당 컨트롤러의 모든 클러스터 링크가 다운되는 경우) ONTAP은 자동으로 테이크오버를 수행합니다.

  • 스토리지 시스템의 다른 모든 구성 요소가 올바르게 작동해야 합니다. 그렇지 않은 경우 이 절차를 계속하기 전에 에 문의하십시오 "NetApp 지원".

2단계: 스토리지 시스템 및 I/O 모듈 슬롯을 준비합니다.

장애가 발생한 I/O 모듈을 안전하게 제거할 수 있도록 스토리지 시스템과 I/O 모듈 슬롯을 준비하십시오.

단계
  1. 적절하게 접지합니다.

  2. 케이블에 라벨을 붙여 케이블이 연결된 위치를 식별한 다음 대상 I/O 모듈에서 모든 케이블을 분리하십시오.

    참고

    I/O 모듈에 오류가 발생해야 합니다(포트가 링크 다운 상태여야 함). 그러나 링크가 여전히 활성화되어 있고 마지막으로 작동하는 클러스터 포트가 포함되어 있는 경우 케이블을 분리하면 자동 테이크오버가 트리거됩니다.

    케이블을 분리한 후 5분 정도 기다려 테이크오버 또는 LIF 페일오버가 완전히 완료되었는지 확인한 후 이 절차를 진행하십시오.

  3. AutoSupport가 활성화된 경우 AutoSupport 메시지를 호출하여 자동 케이스 생성을 억제합니다.

    system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

    예를 들어, 다음 AutoSupport 메시지는 2시간 동안 자동 케이스 생성을 억제합니다.

    node2::> system node autosupport invoke -node * -type all -message MAINT=2h

  4. 파트너 노드가 테이크오버된 경우 자동 반환을 비활성화합니다.

    만약…​ 그러면…​

    어느 한쪽 컨트롤러가 자동으로 파트너를 인수한 경우

    자동 환불 비활성화:

    1. 파트너를 인수한 컨트롤러의 콘솔에서 다음 명령을 입력합니다.

      storage failover modify -node local -auto-giveback false

    2. 입력하다 y _자동 환불을 비활성화하시겠습니까?_라는 메시지가 표시되면

    두 컨트롤러 모두 I/O(데이터 제공)를 실행하고 있습니다

    다음 단계로 이동합니다.

  5. 장애가 발생한 I/O 모듈을 서비스에서 제거하고 전원을 꺼서 제거 준비를 합니다.

    1. 다음 명령을 입력하세요:

      system controller slot module remove -node impaired_node_name -slot slot_number

    2. 입력하다 y _계속하시겠습니까?_라는 메시지가 표시되면

      예를 들어, 다음 명령은 node 2(손상된 컨트롤러)의 슬롯 7에 있는 장애가 발생한 모듈을 제거할 수 있도록 준비하고 제거해도 안전하다는 메시지를 표시합니다.

    node2::> system controller slot module remove -node node2 -slot 7
    
    Warning: IO_2X_100GBE_NVDA_NIC module in slot 7 of node node2 will be powered off for removal.
    
    Do you want to continue? {y|n}: y
    
    The module has been successfully removed from service and powered off. It can now be safely removed.
  6. 장애가 발생한 I/O 모듈의 전원이 꺼져 있는지 확인합니다.

    system controller slot module show

    출력 결과에는 오류가 발생한 모듈과 해당 슬롯 번호에 대해 status 열에 `powered-off`이(가) 표시되어야 합니다.

3단계: 장애가 발생한 I/O 모듈 교체

고장난 I/O 모듈을 동등한 I/O 모듈로 교체하십시오.

단계
  1. 아직 접지되지 않은 경우 올바르게 접지하십시오.

  2. 케이블 관리 트레이 안쪽에 있는 버튼을 당기고 아래로 돌려 케이블 관리 트레이를 아래로 돌립니다.

  3. 컨트롤러 모듈에서 I/O 모듈을 분리합니다.

    참고 다음 그림은 수평 및 수직 I/O 모듈을 제거하는 방법을 보여줍니다. 일반적으로는 I/O 모듈 하나만 제거합니다.
    입출력 모듈을 분리합니다

    설명선 번호 1

    캠 잠금 버튼

    1. 캠 래치 버튼을 누릅니다.

    2. 캠 래치를 모듈에서 최대한 멀리 돌립니다.

    3. 손가락을 캠 레버 입구에 넣고 모듈을 컨트롤러 모듈에서 당겨 모듈을 분리합니다.

      I/O 모듈이 어느 슬롯에 장착되었는지 기록해 두십시오.

  4. 입출력 모듈을 따로 보관해 둡니다.

  5. 교체용 입출력 모듈을 타겟 슬롯에 설치합니다.

    1. 입출력 모듈을 슬롯의 가장자리에 맞춥니다.

    2. 모듈을 조심스럽게 슬롯에 밀어 넣고, 캠 래치를 위로 끝까지 돌려 모듈을 제자리에 잠급니다.

  6. I/O 모듈에 케이블을 연결합니다.

  7. 케이블 관리 트레이를 잠금 위치로 돌립니다.

4단계: 교체 I/O 모듈을 온라인 상태로 전환합니다

교체용 I/O 모듈을 온라인 상태로 전환하고, I/O 모듈 포트가 성공적으로 초기화되었는지 확인하고, 슬롯에 전원이 공급되는지 확인한 다음, I/O 모듈이 온라인 상태이고 인식되는지 확인합니다.

이 작업에 대해

I/O 모듈을 교체하고 포트가 정상 상태로 돌아온 후 LIF가 교체된 I/O 모듈로 되돌아갑니다.

단계
  1. 교체용 I/O 모듈을 온라인 상태로 전환합니다.

    1. 다음 명령을 입력하세요:

      system controller slot module insert -node impaired_node_name -slot slot_number

    2. 입력하다 y _계속하시겠습니까?_라는 메시지가 표시되면

      출력 결과는 I/O 모듈이 성공적으로 온라인 상태(전원 켜짐, 초기화 및 서비스 투입)가 되었음을 확인해야 합니다.

      예를 들어, 다음 명령은 노드 2(손상된 컨트롤러)의 슬롯 7을 온라인 상태로 만들고 프로세스가 성공했다는 메시지를 표시합니다.

    node2::> system controller slot module insert -node node2 -slot 7
    
    Warning: IO_2X_100GBE_NVDA_NIC module in slot 7 of node node2 will be powered on and initialized.
    
    Do you want to continue? {y|n}: `y`
    
    The module has been successfully powered on, initialized and placed into service.
  2. I/O 모듈의 각 포트가 성공적으로 초기화되었는지 확인하십시오.

    1. 손상된 컨트롤러의 콘솔에서 다음 명령을 입력하세요.

      event log show -event *hotplug.init*

      참고 필요한 펌웨어 업데이트 및 포트 초기화에 몇 분 정도 소요될 수 있습니다.

      출력에는 하나 이상의 hotplug.init.success EMS 이벤트와 hotplug.init.success: `Event`열에 I/O 모듈의 각 포트가 성공적으로 초기화되었음을 나타내는 내용이 표시되어야 합니다.

      예를 들어, 다음 출력은 I/O 포트 e7b 및 e7a에 대한 초기화가 성공했음을 보여줍니다.

    node2::> event log show -event *hotplug.init*
    
    Time                Node             Severity      Event
    
    ------------------- ---------------- ------------- ---------------------------
    
    7/11/2025 16:04:06  node2      NOTICE        hotplug.init.success: Initialization of ports "e7b" in slot 7 succeeded
    
    7/11/2025 16:04:06  node2      NOTICE        hotplug.init.success: Initialization of ports "e7a" in slot 7 succeeded
    
    2 entries were displayed.
    1. 포트 초기화에 실패하면 EMS 로그를 검토하여 다음 단계를 확인하십시오.

  3. I/O 모듈 슬롯에 전원이 공급되고 작동 준비가 완료되었는지 확인하십시오.

    system controller slot module show

    출력 결과에는 슬롯 상태가 `powered-on`로 표시되어야 하며, 이는 I/O 모듈 작동 준비가 완료되었음을 의미합니다.

  4. I/O 모듈이 온라인 상태이고 인식되었는지 확인하십시오.

    손상된 컨트롤러의 콘솔에서 명령을 입력하세요:

    system controller config show -node local -slot slot_number

    I/O 모듈이 성공적으로 온라인 상태가 되어 인식되면 출력에는 슬롯의 포트 정보를 포함한 I/O 모듈 정보가 표시됩니다.

    예를 들어, 슬롯 7의 I/O 모듈에 대해 다음과 유사한 출력이 표시됩니다.

    node2::> system controller config show -node local -slot 7
    
    Node: node2
    Sub- Device/
    Slot slot Information
    ---- ---- -----------------------------
       7    - Dual 40G/100G Ethernet Controller CX6-DX
                      e7a MAC Address: d0:39:ea:59:69:74 (auto-100g_cr4-fd-up)
                              QSFP Vendor:        CISCO-BIZLINK
                              QSFP Part Number:   L45593-D218-D10
                              QSFP Serial Number: LCC2807GJFM-B
                      e7b MAC Address: d0:39:ea:59:69:75 (auto-100g_cr4-fd-up)
                              QSFP Vendor:        CISCO-BIZLINK
                              QSFP Part Number:   L45593-D218-D10
                              QSFP Serial Number: LCC2809G26F-A
                      Device Type:        CX6-DX PSID(NAP0000000027)
                      Firmware Version:   22.44.1700
                      Part Number:        111-05341
                      Hardware Revision:  20
                      Serial Number:      032403001370

5단계: 스토리지 시스템을 정상 작동 상태로 복원합니다.

스토리지 시스템을 정상 작동 상태로 복원하려면 (필요에 따라) 테이크오버된 컨트롤러에 스토리지를 반환하고, (필요에 따라) 자동 반환 기능을 복원하고, LIF가 홈 포트에 있는지 확인하고, AutoSupport 자동 케이스 생성 기능을 다시 활성화하십시오.

단계
  1. 스토리지 시스템에서 실행 중인 ONTAP 버전과 컨트롤러 상태에 따라 필요에 따라 인수된 컨트롤러에서 스토리지를 반환하고 자동 반환을 복원합니다.

    만약…​ 그러면…​

    어느 한쪽 컨트롤러가 자동으로 파트너를 인수한 경우

    1. 스토리지를 반환하여 테이크오버된 컨트롤러를 정상 작동 상태로 되돌립니다.

      storage failover giveback -ofnode controller that was taken over_name

    2. 인수된 컨트롤러의 콘솔에서 자동 반환을 복원합니다.

      storage failover modify -node local -auto-giveback true

    두 컨트롤러 모두 I/O(데이터 제공)를 실행하고 있습니다

    다음 단계로 이동합니다.

  2. 논리 인터페이스가 홈 노드 및 포트에 보고하는지 확인합니다. network interface show -is-home false

    LIF가 FALSE로 표시되면 해당 LIF를 홈 포트로 되돌립니다. network interface revert -vserver * -lif *

  3. AutoSupport가 활성화된 경우 자동 케이스 생성을 복원합니다.

    system node autosupport invoke -node * -type all -message MAINT=end

6단계: 장애가 발생한 부품을 NetApp에 반환

키트와 함께 제공된 RMA 지침에 설명된 대로 오류가 발생한 부품을 NetApp에 반환합니다. "부품 반환 및 교체"자세한 내용은 페이지를 참조하십시오.