Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

어플라이언스의 스토리지 볼륨에 오브젝트 데이터를 복원합니다

기여자

어플라이언스 스토리지 노드의 스토리지 볼륨을 복구한 후 스토리지 노드에 장애가 발생할 때 손실된 객체 데이터를 복구할 수 있습니다.

필요한 것
  • 복구된 스토리지 노드의 접속 상태가 * 연결됨 * 으로 확인되어야 합니다아이콘 경고 녹색 확인 표시 그리드 관리자의 * 노드 * > * 개요 * 탭에서.

이 작업에 대해

그리드의 ILM 규칙이 구성되어 있어 오브젝트 복사본을 사용할 수 있다고 가정할 때 다른 스토리지 노드, 아카이브 노드 또는 클라우드 스토리지 풀에서 오브젝트 데이터를 복원할 수 있습니다.

중요함 ILM 규칙이 한 개의 복제된 복사본만 저장하도록 구성되었고 해당 복사본이 실패한 스토리지 볼륨에 존재하면 개체를 복구할 수 없습니다.
중요함 개체의 나머지 복사본만 클라우드 스토리지 풀에 있는 경우 StorageGRID은 오브젝트 데이터를 복원하기 위해 클라우드 스토리지 풀 엔드포인트에 여러 요청을 실행해야 합니다. 이 절차를 수행하기 전에 기술 지원 부서에 문의하여 복구 시간 프레임 및 관련 비용을 추정하십시오.
참고 개체의 나머지 복사본만 아카이브 노드에 있는 경우 아카이브 노드에서 개체 데이터가 검색됩니다. 외부 아카이브 스토리지 시스템에서 검색을 수행할 때 지연 시간이 길기 때문에 아카이브 노드에서 오브젝트 데이터를 스토리지 노드로 복원하는 것은 다른 스토리지 노드에서 복사본을 복원하는 것보다 시간이 더 오래 걸립니다.

개체 데이터를 복원하려면 를 실행합니다 repair-data 스크립트. 이 스크립트는 개체 데이터 복원 프로세스를 시작하고 ILM 스캔 작업을 통해 ILM 규칙이 충족되는지 확인합니다. 에서는 다른 옵션을 사용합니다 repair-data 복제 데이터 복원 또는 삭제 코딩 데이터 여부에 따라 다음과 같은 스크립트를 사용할 수 있습니다.

  • * 복제된 데이터 *: 전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 복제된 데이터를 복원할 수 있습니다.

    repair-data start-replicated-node-repair
    repair-data start-replicated-volume-repair
  • * EC(삭제 코딩) 데이터 *: 전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 개의 명령을 사용하여 삭제 코딩 데이터를 복원할 수 있습니다.

    repair-data start-ec-node-repair
    repair-data start-ec-volume-repair

    일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. 다음 명령을 사용하여 삭제 코딩 데이터의 복구를 추적할 수 있습니다.

    repair-data show-ec-repair-status
참고 EC 복구 작업은 일시적으로 많은 양의 저장 공간을 예약합니다. 스토리지 알림이 트리거될 수 있지만 복구가 완료되면 문제가 해결됩니다. 예약 저장 공간이 충분하지 않으면 EC 복구 작업이 실패합니다. 작업 실패 또는 성공 여부에 관계없이 EC 복구 작업이 완료되면 저장소 예약이 해제됩니다.

를 사용하는 방법에 대한 자세한 내용은 를 참조하십시오 repair-data 스크립트에 를 입력합니다 repair-data --help 기본 관리 노드의 명령줄에 입력합니다.

단계
  1. 기본 관리자 노드에 로그인합니다.

    1. 다음 명령을 입력합니다. ssh admin@primary_Admin_Node_IP

    2. 에 나열된 암호를 입력합니다 Passwords.txt 파일.

    3. 루트로 전환하려면 다음 명령을 입력합니다. su -

    4. 에 나열된 암호를 입력합니다 Passwords.txt 파일.

      루트로 로그인하면 프롬프트가 에서 변경됩니다 $ 를 선택합니다 #.

  2. 를 사용합니다 /etc/hosts 복구된 스토리지 볼륨에 대한 스토리지 노드의 호스트 이름을 찾는 파일 그리드의 모든 노드 목록을 보려면 다음을 입력합니다. cat /etc/hosts

  3. 모든 스토리지 볼륨에 장애가 발생한 경우 전체 노드를 복구합니다. (일부 볼륨만 실패한 경우 다음 단계로 이동합니다.)

    중요함 실행할 수 없습니다 repair-data 동시에 둘 이상의 노드에 대한 작업. 여러 노드를 복구하려면 기술 지원 팀에 문의하십시오.
    • 그리드에 복제된 데이터가 포함된 경우 를 사용합니다 repair-data start-replicated-node-repair 명령과 함께 --nodes 전체 스토리지 노드를 복구하는 옵션입니다.

      이 명령은 SG-DC-SN3이라는 스토리지 노드에서 복제된 데이터를 복구합니다.

      repair-data start-replicated-node-repair --nodes SG-DC-SN3
      참고 개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없을 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 손실의 원인과 복구가 가능한지 확인해야 합니다. StorageGRID 모니터링 및 문제 해결에 대한 지침을 참조하십시오.
    • 그리드에 삭제 코딩 데이터가 포함된 경우 를 사용하십시오 repair-data start-ec-node-repair 명령과 함께 --nodes 전체 스토리지 노드를 복구하는 옵션입니다.

      이 명령은 이름이 SG-DC-SN3인 스토리지 노드에서 삭제 코딩 데이터를 복구합니다.

      repair-data start-ec-node-repair --nodes SG-DC-SN3

      작업에서 고유한 값을 반환합니다 repair ID 이를 식별합니다 repair_data 작동. 이 옵션을 사용합니다 repair ID 의 진행 상황과 결과를 추적합니다 repair_data 작동. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.

    참고 일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다.
    • 그리드에 복제된 데이터와 삭제 코딩 데이터가 모두 있는 경우 두 명령을 모두 실행하십시오.

  4. 일부 볼륨만 장애가 발생한 경우 영향을 받는 볼륨을 복구합니다.

    볼륨 ID를 16진수로 입력합니다. 예를 들면, 다음과 같습니다. 0000 은(는) 첫 번째 볼륨이며 000F 16번째 볼륨입니다. 하나의 볼륨, 하나의 볼륨 범위 또는 시퀀스에 없는 여러 볼륨을 지정할 수 있습니다.

    모든 볼륨은 동일한 스토리지 노드에 있어야 합니다. 둘 이상의 스토리지 노드에 대한 볼륨을 복원해야 하는 경우 기술 지원 부서에 문의하십시오.

    • 그리드에 복제된 데이터가 포함된 경우 를 사용합니다 start-replicated-volume-repair 명령과 함께 --nodes 노드를 식별하는 옵션입니다. 그런 다음 를 추가합니다 --volumes 또는 --volume-range 다음 예에 표시된 대로 옵션을 선택합니다.

      • 단일 볼륨 *: 이 명령은 복제된 데이터를 볼륨으로 복원합니다 0002 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002
      • 볼륨 범위 *: 이 명령은 복제된 데이터를 범위 내의 모든 볼륨에 복원합니다 0003 를 선택합니다 0009 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003-0009
      • 다중 볼륨이 시퀀스에 없음 *: 이 명령은 복제된 데이터를 볼륨으로 복원합니다 0001, 0005, 및 0008 SG-DC-SN3이라는 스토리지 노드:

      repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008

      +

      참고 개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없을 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 손실의 원인과 복구가 가능한지 확인해야 합니다. StorageGRID 모니터링 및 문제 해결에 대한 지침을 참조하십시오.
    • 그리드에 삭제 코딩 데이터가 포함된 경우 를 사용하십시오 start-ec-volume-repair 명령과 함께 --nodes 노드를 식별하는 옵션입니다. 그런 다음 를 추가합니다 --volumes 또는 --volume-range 다음 예에 표시된 대로 옵션을 선택합니다.

      • 단일 볼륨 *: 이 명령은 삭제 코딩 데이터를 볼륨으로 복원합니다 0007 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007
      • 볼륨 범위 *: 이 명령은 삭제 코딩 데이터를 범위의 모든 볼륨에 복원합니다 0004 를 선택합니다 0006 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004-0006
      • 여러 볼륨이 한 번에 없음 *: 이 명령은 삭제 코딩 데이터를 볼륨으로 복원합니다 000A, 000C, 및 000E SG-DC-SN3이라는 스토리지 노드:

      repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E

      + 를 클릭합니다 repair-data 작업에서 고유한 값을 반환합니다 repair ID 이를 식별합니다 repair_data 작동. 이 옵션을 사용합니다 repair ID 의 진행 상황과 결과를 추적합니다 repair_data 작동. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.

    참고 일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다.
    • 그리드에 복제된 데이터와 삭제 코딩 데이터가 모두 있는 경우 두 명령을 모두 실행하십시오.

  5. 복제된 데이터의 복구를 모니터링합니다.

    1. 노드 * > * 복구되는 스토리지 노드 * > * ILM * 을 선택합니다.

    2. 평가 섹션의 속성을 사용하여 수리가 완료되었는지 확인합니다.

      복구가 완료되면 Awaiting-all 속성은 0 객체를 나타냅니다.

    3. 수리를 자세히 모니터링하려면 * 지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.

    4. 그리드 * > * 복구되는 스토리지 노드 * > * LDR * > * 데이터 저장소 * 를 선택합니다.

    5. 복제된 수리가 완료된 경우 다음 특성을 조합하여 가능한 한 결정합니다.

      참고 Cassandra의 일관성이 없을 수 있으며, 복구 실패를 추적하지 않습니다.
      • * 시도된 복구(XRPA) : 이 속성을 사용하여 복제된 복구 진행률을 추적합니다. 이 속성은 스토리지 노드가 고위험 객체를 복구하려고 할 때마다 증가합니다. 이 속성이 현재 스캔 기간( Scan Period — Estimated* 속성 제공)보다 더 긴 기간 동안 증가하지 않으면 ILM 스캐닝에서 모든 노드에서 복구해야 할 고위험 개체를 찾지 못한 것입니다.

        참고 고위험 개체는 완전히 손실될 위험이 있는 개체입니다. ILM 구성을 충족하지 않는 개체는 포함되지 않습니다.
      • * 스캔 기간 — 예상(XSCM) *: 이 속성을 사용하여 이전에 수집된 개체에 정책 변경이 적용되는 시점을 추정합니다. 복구 시도 * 속성이 현재 스캔 기간보다 긴 기간 동안 증가하지 않으면 복제된 수리가 수행될 수 있습니다. 스캔 기간은 변경될 수 있습니다. 스캔 기간 — 예상(XSCM) * 속성은 전체 그리드에 적용되며 모든 노드 스캔 기간의 최대값입니다. 그리드에 대한 * Scan Period — Estimated * 속성 기록을 조회하여 적절한 기간을 결정할 수 있습니다.

  6. 삭제 코딩 데이터의 복구를 모니터링하고 실패한 요청을 다시 시도하십시오.

    1. 삭제 코딩 데이터 복구 상태를 확인합니다.

      • 이 명령을 사용하여 특정 의 상태를 확인할 수 있습니다 repair-data 작동:

        repair-data show-ec-repair-status --repair-id repair ID
      • 이 명령을 사용하여 모든 수리를 나열합니다.

        repair-data show-ec-repair-status

        출력에는 을 포함한 정보가 나열됩니다 repair ID, 모든 이전 및 현재 실행 중인 수리에 대해 .

      root@DC1-ADM1:~ # repair-data show-ec-repair-status
      
      Repair ID Scope Start Time  End Time  State  Est Bytes Affected/Repaired Retry Repair
      =====================================================================================
       949283 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:27:06.9 Success 17359 17359 No
       949292 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:37:06.9 Failure 17359 0     Yes
       949294 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:47:06.9 Failure 17359 0     Yes
       949299 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:57:06.9 Failure 17359 0     Yes
    2. 출력에 복구 작업이 실패한 것으로 표시되는 경우 를 사용합니다 --repair-id 복구를 재시도하는 옵션입니다.

      이 명령은 복구 ID를 사용하여 실패한 노드 복구를 다시 시도합니다 83930030303133434:

      repair-data start-ec-node-repair --repair-id 83930030303133434

      이 명령은 복구 ID를 사용하여 실패한 볼륨 복구를 다시 시도합니다 83930030303133434:

    repair-data start-ec-volume-repair --repair-id 83930030303133434