Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

필요한 경우 오브젝트 데이터를 스토리지 볼륨에 복원

기여자

를 누릅니다 sn-recovery-postinstall.sh 스크립트는 하나 이상의 실패한 스토리지 볼륨을 다시 포맷하는 데 필요합니다. 다른 스토리지 노드 및 아카이브 노드에서 포맷된 스토리지 볼륨으로 객체 데이터를 복원해야 합니다. 하나 이상의 스토리지 볼륨을 다시 포맷하지 않으면 이러한 단계가 필요하지 않습니다.

필요한 것
  • 복구된 스토리지 노드의 접속 상태가 * 연결됨 * 으로 확인되어야 합니다아이콘 경고 녹색 확인 표시 그리드 관리자의 * 노드 * > * 개요 * 탭에서.

이 작업에 대해

그리드의 ILM 규칙이 구성되어 있어 오브젝트 복사본을 사용할 수 있다고 가정할 때 다른 스토리지 노드, 아카이브 노드 또는 클라우드 스토리지 풀에서 오브젝트 데이터를 복원할 수 있습니다.

중요함 ILM 규칙이 한 개의 복제된 복사본만 저장하도록 구성되었고 해당 복사본이 실패한 스토리지 볼륨에 존재하면 개체를 복구할 수 없습니다.
중요함 개체의 나머지 복사본만 클라우드 스토리지 풀에 있는 경우 StorageGRID은 오브젝트 데이터를 복원하기 위해 클라우드 스토리지 풀 엔드포인트에 여러 요청을 실행해야 합니다. 이 절차를 수행하기 전에 기술 지원 부서에 문의하여 복구 시간 프레임 및 관련 비용을 추정하십시오.
참고 개체의 나머지 복사본만 아카이브 노드에 있는 경우 아카이브 노드에서 개체 데이터가 검색됩니다. 외부 아카이브 스토리지 시스템에서 검색을 수행할 때 지연 시간이 길기 때문에 아카이브 노드에서 오브젝트 데이터를 스토리지 노드로 복원하는 것은 다른 스토리지 노드에서 복사본을 복원하는 것보다 시간이 더 오래 걸립니다.

개체 데이터를 복원하려면 를 실행합니다 repair-data 스크립트. 이 스크립트는 개체 데이터 복원 프로세스를 시작하고 ILM 스캔 작업을 통해 ILM 규칙이 충족되는지 확인합니다. 에서는 다른 옵션을 사용합니다 repair-data 복제 데이터 복원 또는 삭제 코딩 데이터 여부에 따라 다음과 같은 스크립트를 사용할 수 있습니다.

  • * 복제된 데이터 *: 전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 복제된 데이터를 복원할 수 있습니다.

    repair-data start-replicated-node-repair
    repair-data start-replicated-volume-repair
  • * EC(삭제 코딩) 데이터 *: 전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 개의 명령을 사용하여 삭제 코딩 데이터를 복원할 수 있습니다.

    repair-data start-ec-node-repair
    repair-data start-ec-volume-repair

    일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. 다음 명령을 사용하여 삭제 코딩 데이터의 복구를 추적할 수 있습니다.

    repair-data show-ec-repair-status
참고 EC 복구 작업은 일시적으로 많은 양의 저장 공간을 예약합니다. 스토리지 알림이 트리거될 수 있지만 복구가 완료되면 문제가 해결됩니다. 예약 저장 공간이 충분하지 않으면 EC 복구 작업이 실패합니다. 작업 실패 또는 성공 여부에 관계없이 EC 복구 작업이 완료되면 저장소 예약이 해제됩니다.

를 사용하는 방법에 대한 자세한 내용은 를 참조하십시오 repair-data 스크립트에 를 입력합니다 repair-data --help 기본 관리 노드의 명령줄에 입력합니다.

단계
  1. 기본 관리자 노드에 로그인합니다.

    1. 다음 명령을 입력합니다. ssh admin@primary_Admin_Node_IP

    2. 에 나열된 암호를 입력합니다 Passwords.txt 파일.

    3. 루트로 전환하려면 다음 명령을 입력합니다. su -

    4. 에 나열된 암호를 입력합니다 Passwords.txt 파일.

      루트로 로그인하면 프롬프트가 에서 변경됩니다 $ 를 선택합니다 #.

  2. 를 사용합니다 /etc/hosts 복구된 스토리지 볼륨에 대한 스토리지 노드의 호스트 이름을 찾는 파일 그리드의 모든 노드 목록을 보려면 다음을 입력합니다. cat /etc/hosts

  3. 모든 스토리지 볼륨에 장애가 발생한 경우 전체 노드를 복구합니다. (일부 볼륨만 실패한 경우 다음 단계로 이동합니다.)

    중요함 실행할 수 없습니다 repair-data 동시에 둘 이상의 노드에 대한 작업. 여러 노드를 복구하려면 기술 지원 팀에 문의하십시오.
    • 그리드에 복제된 데이터가 포함된 경우 를 사용합니다 repair-data start-replicated-node-repair 명령과 함께 --nodes 전체 스토리지 노드를 복구하는 옵션입니다.

      이 명령은 SG-DC-SN3이라는 스토리지 노드에서 복제된 데이터를 복구합니다.

      repair-data start-replicated-node-repair --nodes SG-DC-SN3
      참고 개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없을 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 손실의 원인과 복구가 가능한지 확인해야 합니다. StorageGRID 모니터링 및 문제 해결에 대한 지침을 참조하십시오.
    • 그리드에 삭제 코딩 데이터가 포함된 경우 를 사용하십시오 repair-data start-ec-node-repair 명령과 함께 --nodes 전체 스토리지 노드를 복구하는 옵션입니다.

      이 명령은 이름이 SG-DC-SN3인 스토리지 노드에서 삭제 코딩 데이터를 복구합니다.

      repair-data start-ec-node-repair --nodes SG-DC-SN3

      작업에서 고유한 값을 반환합니다 repair ID 이를 식별합니다 repair_data 작동. 이 옵션을 사용합니다 repair ID 의 진행 상황과 결과를 추적합니다 repair_data 작동. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.

    참고 일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다.
    • 그리드에 복제된 데이터와 삭제 코딩 데이터가 모두 있는 경우 두 명령을 모두 실행하십시오.

  4. 일부 볼륨만 장애가 발생한 경우 영향을 받는 볼륨을 복구합니다.

    볼륨 ID를 16진수로 입력합니다. 예를 들면, 다음과 같습니다. 0000 은(는) 첫 번째 볼륨이며 000F 16번째 볼륨입니다. 하나의 볼륨, 하나의 볼륨 범위 또는 시퀀스에 없는 여러 볼륨을 지정할 수 있습니다.

    모든 볼륨은 동일한 스토리지 노드에 있어야 합니다. 둘 이상의 스토리지 노드에 대한 볼륨을 복원해야 하는 경우 기술 지원 부서에 문의하십시오.

    • 그리드에 복제된 데이터가 포함된 경우 를 사용합니다 start-replicated-volume-repair 명령과 함께 --nodes 노드를 식별하는 옵션입니다. 그런 다음 를 추가합니다 --volumes 또는 --volume-range 다음 예에 표시된 대로 옵션을 선택합니다.

      • 단일 볼륨 *: 이 명령은 복제된 데이터를 볼륨으로 복원합니다 0002 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002
      • 볼륨 범위 *: 이 명령은 복제된 데이터를 범위 내의 모든 볼륨에 복원합니다 0003 를 선택합니다 0009 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003-0009
      • 다중 볼륨이 시퀀스에 없음 *: 이 명령은 복제된 데이터를 볼륨으로 복원합니다 0001, 0005, 및 0008 SG-DC-SN3이라는 스토리지 노드:

      repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008

      +

      참고 개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없을 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 손실의 원인과 복구가 가능한지 확인해야 합니다. StorageGRID 모니터링 및 문제 해결에 대한 지침을 참조하십시오.
    • 그리드에 삭제 코딩 데이터가 포함된 경우 를 사용하십시오 start-ec-volume-repair 명령과 함께 --nodes 노드를 식별하는 옵션입니다. 그런 다음 를 추가합니다 --volumes 또는 --volume-range 다음 예에 표시된 대로 옵션을 선택합니다.

      • 단일 볼륨 *: 이 명령은 삭제 코딩 데이터를 볼륨으로 복원합니다 0007 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007
      • 볼륨 범위 *: 이 명령은 삭제 코딩 데이터를 범위의 모든 볼륨에 복원합니다 0004 를 선택합니다 0006 SG-DC-SN3이라는 스토리지 노드:

        repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004-0006
      • 여러 볼륨이 한 번에 없음 *: 이 명령은 삭제 코딩 데이터를 볼륨으로 복원합니다 000A, 000C, 및 000E SG-DC-SN3이라는 스토리지 노드:

      repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E

      + 를 클릭합니다 repair-data 작업에서 고유한 값을 반환합니다 repair ID 이를 식별합니다 repair_data 작동. 이 옵션을 사용합니다 repair ID 의 진행 상황과 결과를 추적합니다 repair_data 작동. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.

    참고 일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다.
    • 그리드에 복제된 데이터와 삭제 코딩 데이터가 모두 있는 경우 두 명령을 모두 실행하십시오.

  5. 복제된 데이터의 복구를 모니터링합니다.

    1. 노드 * > * 복구되는 스토리지 노드 * > * ILM * 을 선택합니다.

    2. 평가 섹션의 속성을 사용하여 수리가 완료되었는지 확인합니다.

      복구가 완료되면 Awaiting-all 속성은 0 객체를 나타냅니다.

    3. 수리를 자세히 모니터링하려면 * 지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.

    4. 그리드 * > * 복구되는 스토리지 노드 * > * LDR * > * 데이터 저장소 * 를 선택합니다.

    5. 복제된 수리가 완료된 경우 다음 특성을 조합하여 가능한 한 결정합니다.

      참고 Cassandra의 일관성이 없을 수 있으며, 복구 실패를 추적하지 않습니다.
      • * 시도된 복구(XRPA) : 이 속성을 사용하여 복제된 복구 진행률을 추적합니다. 이 속성은 스토리지 노드가 고위험 객체를 복구하려고 할 때마다 증가합니다. 이 속성이 현재 스캔 기간( Scan Period — Estimated* 속성 제공)보다 더 긴 기간 동안 증가하지 않으면 ILM 스캐닝에서 모든 노드에서 복구해야 할 고위험 개체를 찾지 못한 것입니다.

        참고 고위험 개체는 완전히 손실될 위험이 있는 개체입니다. ILM 구성을 충족하지 않는 개체는 포함되지 않습니다.
      • * 스캔 기간 — 예상(XSCM) *: 이 속성을 사용하여 이전에 수집된 개체에 정책 변경이 적용되는 시점을 추정합니다. 복구 시도 * 속성이 현재 스캔 기간보다 긴 기간 동안 증가하지 않으면 복제된 수리가 수행될 수 있습니다. 스캔 기간은 변경될 수 있습니다. 스캔 기간 — 예상(XSCM) * 속성은 전체 그리드에 적용되며 모든 노드 스캔 기간의 최대값입니다. 그리드에 대한 * Scan Period — Estimated * 속성 기록을 조회하여 적절한 기간을 결정할 수 있습니다.

  6. 삭제 코딩 데이터의 복구를 모니터링하고 실패한 요청을 다시 시도하십시오.

    1. 삭제 코딩 데이터 복구 상태를 확인합니다.

      • 이 명령을 사용하여 특정 의 상태를 확인할 수 있습니다 repair-data 작동:

        repair-data show-ec-repair-status --repair-id repair ID
      • 이 명령을 사용하여 모든 수리를 나열합니다.

        repair-data show-ec-repair-status

        출력에는 을 포함한 정보가 나열됩니다 repair ID, 모든 이전 및 현재 실행 중인 수리에 대해 .

      root@DC1-ADM1:~ # repair-data show-ec-repair-status
      
      Repair ID Scope Start Time End Time State Est Bytes Affected/Repaired Retry Repair
      ==================================================================================
      949283 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:27:06.9 Success 17359 17359 No
      949292 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:37:06.9 Failure 17359 0 Yes
      949294 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:47:06.9 Failure 17359 0 Yes
      949299 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:57:06.9 Failure 17359 0 Yes
    2. 출력에 복구 작업이 실패한 것으로 표시되는 경우 를 사용합니다 --repair-id 복구를 재시도하는 옵션입니다.

      이 명령은 복구 ID 839300303133434를 사용하여 장애가 발생한 노드 복구를 다시 시도합니다.

      repair-data start-ec-node-repair --repair-id 83930030303133434

      이 명령은 복구 ID 839300303133434를 사용하여 실패한 볼륨 복구를 다시 시도합니다.

    repair-data start-ec-volume-repair --repair-id 83930030303133434
관련 정보

"StorageGRID 관리"