시스템 드라이브가 손상되지 않은 스토리지 볼륨에 개체 데이터를 복원합니다
시스템 드라이브가 손상되지 않은 스토리지 노드에서 스토리지 볼륨을 복구한 후에는 스토리지 볼륨 장애 시 손실된 복제된 또는 삭제 코딩 오브젝트 데이터를 복원할 수 있습니다.
어떤 절차를 사용해야 합니까?
가능한 경우 그리드 관리자의 * 볼륨 복원 * 페이지를 사용하여 개체 데이터를 복원합니다.
-
볼륨이 * 유지 관리 * > * 볼륨 복원 * > * 복원할 노드 * 에 나열되면 를 사용하여 개체 데이터를 복원합니다 "Grid Manager의 볼륨 복원 페이지".
-
볼륨이 * 유지 관리 * > * 볼륨 복원 * > * 복원할 노드 * 에 나열되지 않은 경우 아래 단계에 따라 를 사용하십시오
repair-data
객체 데이터를 복원하는 스크립트입니다.복구된 스토리지 노드에 교체할 노드보다 적은 볼륨이 포함되어 있는 경우 를 사용해야 합니다
repair-data
스크립트.
를 사용합니다 repair-data
객체 데이터를 복원하는 스크립트입니다
-
복구된 스토리지 노드의 접속 상태가 * 연결됨 * 으로 확인되어야 합니다 Grid Manager의 * nodes * > * Overview * (노드 * > * 개요 *) 탭에서 선택합니다.
그리드의 ILM 규칙이 구성되어 있어 오브젝트 복사본을 사용할 수 있다고 가정할 때 다른 스토리지 노드, 아카이브 노드 또는 클라우드 스토리지 풀에서 오브젝트 데이터를 복원할 수 있습니다.
다음 사항에 유의하십시오.
-
ILM 규칙이 한 개의 복제된 복사본만 저장하도록 구성되었고 해당 복사본이 실패한 스토리지 볼륨에 존재하면 개체를 복구할 수 없습니다.
-
개체의 나머지 복사본만 클라우드 스토리지 풀에 있는 경우 StorageGRID은 오브젝트 데이터를 복원하기 위해 클라우드 스토리지 풀 엔드포인트에 여러 요청을 실행해야 합니다. 이 절차를 수행하기 전에 기술 지원 부서에 문의하여 복구 시간 프레임 및 관련 비용을 추정하십시오.
-
개체의 나머지 복사본만 아카이브 노드에 있는 경우 아카이브 노드에서 개체 데이터가 검색됩니다. 아카이브 노드에서 스토리지 노드로 오브젝트 데이터를 복원하는 것은 외부 아카이브 스토리지 시스템에서 검색 지연 시간 때문에 다른 스토리지 노드에서 복사본을 복원하는 것보다 시간이 더 오래 걸립니다.
에 대해 repair-data
스크립트
개체 데이터를 복원하려면 를 실행합니다 repair-data
스크립트. 이 스크립트는 개체 데이터 복원 프로세스를 시작하고 ILM 스캔 작업을 통해 ILM 규칙이 충족되는지 확인합니다.
아래의 * 복제된 데이터 * 또는 * EC(삭제 코딩) 데이터 * 를 선택하여 에 대한 다양한 옵션을 알아보십시오 repair-data
복제 데이터 복원 또는 삭제 코딩 데이터 복원 여부에 따라 스크립트를 작성할 수 있습니다. 두 유형의 데이터를 모두 복원해야 하는 경우 두 명령 집합을 모두 실행해야 합니다.
에 대한 자세한 내용은 를 참조하십시오 repair-data 스크립트에 를 입력합니다 repair-data --help 기본 관리 노드의 명령줄에 입력합니다.
|
전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 복제된 데이터를 복원할 수 있습니다.
repair-data start-replicated-node-repair
repair-data start-replicated-volume-repair
다음 명령을 사용하여 복제된 데이터의 복구를 추적할 수 있습니다.
repair-data show-replicated-repair-status
전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 삭제 코딩 데이터를 복원할 수 있습니다.
repair-data start-ec-node-repair
repair-data start-ec-volume-repair
다음 명령을 사용하여 삭제 코딩 데이터의 복구를 추적할 수 있습니다.
repair-data show-ec-repair-status
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 하지만 삭제 코딩 데이터를 모두 처리할 수 없는 경우 복구를 완료할 수 없습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
EC 복구 작업은 일시적으로 많은 양의 저장 공간을 예약합니다. 스토리지 알림이 트리거될 수 있지만 복구가 완료되면 문제가 해결됩니다. 예약 저장 공간이 충분하지 않으면 EC 복구 작업이 실패합니다. 작업 실패 또는 성공 여부에 관계없이 EC 복구 작업이 완료되면 저장소 예약이 해제됩니다. |
스토리지 노드의 호스트 이름을 찾습니다
-
기본 관리자 노드에 로그인합니다.
-
다음 명령을 입력합니다.
ssh admin@primary_Admin_Node_IP
-
에 나열된 암호를 입력합니다
Passwords.txt
파일. -
루트로 전환하려면 다음 명령을 입력합니다.
su -
-
에 나열된 암호를 입력합니다
Passwords.txt
파일.루트로 로그인하면 프롬프트가 에서 변경됩니다
$
를 선택합니다#
.
-
-
를 사용합니다
/etc/hosts
복구된 스토리지 볼륨에 대한 스토리지 노드의 호스트 이름을 찾는 파일 그리드의 모든 노드 목록을 보려면 다음을 입력합니다.cat /etc/hosts
.
모든 볼륨이 실패한 경우 데이터를 복구합니다
모든 스토리지 볼륨에 장애가 발생한 경우 전체 노드를 복구합니다. 복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 다에 대한 지침을 따르십시오. 복제된 데이터, 삭제 코딩(EC) 데이터 또는 둘 모두를 사용하는지 여부에 따라 달라집니다.
일부 볼륨만 장애가 발생한 경우 로 이동합니다 일부 볼륨만 장애가 발생한 경우 데이터를 복구합니다.
실행할 수 없습니다 repair-data 동시에 둘 이상의 노드에 대한 작업. 여러 노드를 복구하려면 기술 지원 팀에 문의하십시오.
|
그리드에 복제된 데이터가 포함된 경우 를 사용합니다 repair-data start-replicated-node-repair
명령과 함께 --nodes
옵션, 위치 --nodes
전체 스토리지 노드를 복구할 호스트 이름(시스템 이름)입니다.
이 명령은 SG-DC-SN3이라는 스토리지 노드에서 복제된 데이터를 복구합니다.
repair-data start-replicated-node-repair --nodes SG-DC-SN3
개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없는 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 손실의 원인과 복구가 가능한지 확인해야 합니다. 을 참조하십시오 "손실된 개체를 조사합니다". |
그리드에 삭제 코딩 데이터가 포함된 경우 를 사용하십시오 repair-data start-ec-node-repair
명령과 함께 --nodes
옵션, 위치 --nodes
전체 스토리지 노드를 복구할 호스트 이름(시스템 이름)입니다.
이 명령은 이름이 SG-DC-SN3인 스토리지 노드에서 삭제 코딩 데이터를 복구합니다.
repair-data start-ec-node-repair --nodes SG-DC-SN3
작업에서 고유한 값을 반환합니다 repair ID
이를 식별합니다 repair_data
작동. 이 옵션을 사용합니다 repair ID
의 진행 상황과 결과를 추적합니다 repair_data
작동. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
일부 볼륨만 장애가 발생한 경우 데이터를 복구합니다
일부 볼륨만 장애가 발생한 경우 영향을 받는 볼륨을 복구합니다. 복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 다에 대한 지침을 따르십시오. 복제된 데이터, 삭제 코딩(EC) 데이터 또는 둘 모두를 사용하는지 여부에 따라 달라집니다.
모든 볼륨이 실패한 경우 로 이동합니다 모든 볼륨이 실패한 경우 데이터를 복구합니다.
볼륨 ID를 16진수로 입력합니다. 예를 들면, 다음과 같습니다. 0000
은(는) 첫 번째 볼륨이며 000F
16번째 볼륨입니다. 하나의 볼륨, 하나의 볼륨 범위 또는 하나의 시퀀스에 없는 여러 볼륨을 지정할 수 있습니다.
모든 볼륨은 동일한 스토리지 노드에 있어야 합니다. 둘 이상의 스토리지 노드에 대한 볼륨을 복원해야 하는 경우 기술 지원 부서에 문의하십시오.
그리드에 복제된 데이터가 포함된 경우 를 사용합니다 start-replicated-volume-repair
명령과 함께 --nodes
노드를 식별하는 옵션(여기서 --nodes
은 노드의 호스트 이름입니다. 그런 다음 를 추가합니다 --volumes
또는 --volume-range
다음 예에 표시된 대로 옵션을 선택합니다.
-
단일 볼륨 *: 이 명령은 복제된 데이터를 볼륨으로 복원합니다
0002
SG-DC-SN3이라는 스토리지 노드:
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002
-
볼륨 범위 *: 이 명령은 복제된 데이터를 범위 내의 모든 볼륨에 복원합니다
0003
를 선택합니다0009
SG-DC-SN3이라는 스토리지 노드:
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003,0009
-
다중 볼륨이 시퀀스에 없음 *: 이 명령은 복제된 데이터를 볼륨으로 복원합니다
0001
,0005
, 및0008
SG-DC-SN3이라는 스토리지 노드:
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008
개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없는 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 경고 설명 및 권장 조치를 참고하여 손실의 원인을 파악하고 복구가 가능한지 여부를 확인합니다. |
그리드에 삭제 코딩 데이터가 포함된 경우 를 사용하십시오 start-ec-volume-repair
명령과 함께 --nodes
노드를 식별하는 옵션(여기서 --nodes
은 노드의 호스트 이름입니다. 그런 다음 를 추가합니다 --volumes
또는 --volume-range
다음 예에 표시된 대로 옵션을 선택합니다.
-
단일 볼륨 *: 이 명령은 삭제 코딩 데이터를 볼륨으로 복원합니다
0007
SG-DC-SN3이라는 스토리지 노드:
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007
-
볼륨 범위 *: 이 명령은 삭제 코딩 데이터를 범위의 모든 볼륨으로 복원합니다
0004
를 선택합니다0006
SG-DC-SN3이라는 스토리지 노드:
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004,0006
-
여러 볼륨이 한 번에 없음 *: 이 명령은 삭제 코딩 데이터를 볼륨으로 복원합니다
000A
,000C
, 및000E
SG-DC-SN3이라는 스토리지 노드:
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E
를 클릭합니다 repair-data
작업에서 고유한 값을 반환합니다 repair ID
이를 식별합니다 repair_data
작동. 이 옵션을 사용합니다 repair ID
의 진행 상황과 결과를 추적합니다 repair_data
작동. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
수리 모니터링
복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 모두를 사용하는지 여부에 따라 복구 작업의 상태를 모니터링합니다.
또한 처리 중인 볼륨 복원 작업의 상태를 모니터링하고 에서 완료된 복원 작업의 기록을 볼 수 있습니다"그리드 관리자".
-
복제된 복구에 대한 예상 완료율을 얻으려면 를 추가합니다
show-replicated-repair-status
repair-data 명령에 대한 옵션입니다.repair-data show-replicated-repair-status
-
수리가 완료되었는지 확인하려면:
-
노드 * > * _ 복구되는 스토리지 노드 _ * > * ILM * 을 선택합니다.
-
평가 섹션의 속성을 검토합니다. 복구가 완료되면 * Awaiting-all * 속성이 0 개체를 나타냅니다.
-
-
수리를 더 자세히 모니터링하려면:
-
지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.
-
복구되는 *GRID * > *_Storage Node _ * > * LDR * > * Data Store * 를 선택합니다.
-
복제된 수리가 완료된 경우 다음 특성을 조합하여 가능한 한 결정합니다.
Cassandra의 일관성이 없을 수 있으며, 복구 실패를 추적하지 않습니다. -
* 시도된 복구(XRPA) : 이 속성을 사용하여 복제된 복구 진행률을 추적합니다. 이 속성은 스토리지 노드가 고위험 객체를 복구하려고 할 때마다 증가합니다. 이 속성이 현재 스캔 기간( Scan Period — Estimated* 속성 제공)보다 더 긴 기간 동안 증가하지 않으면 ILM 스캐닝에서 모든 노드에서 복구해야 할 고위험 개체를 찾지 못한 것입니다.
고위험 개체는 완전히 손실될 위험이 있는 개체입니다. ILM 구성을 충족하지 않는 개체는 포함되지 않습니다. -
* 스캔 기간 — 예상(XSCM) *: 이 속성을 사용하여 이전에 수집된 개체에 정책 변경이 적용되는 시점을 추정합니다. 복구 시도 * 속성이 현재 스캔 기간보다 긴 기간 동안 증가하지 않으면 복제된 수리가 수행될 수 있습니다. 스캔 기간은 변경될 수 있습니다. 스캔 기간 — 예상(XSCM) * 속성은 전체 그리드에 적용되며 모든 노드 스캔 기간의 최대값입니다. 그리드에 대한 * Scan Period — Estimated * 속성 기록을 조회하여 적절한 기간을 결정할 수 있습니다.
-
-
삭제 코딩 데이터의 복구를 모니터링하고 실패한 요청을 다시 시도하려면 다음을 수행하십시오.
-
삭제 코딩 데이터 복구 상태를 확인합니다.
-
현재 작업의 예상 완료 시간과 완료 비율을 보려면 * 지원 * > * 도구 * > * 메트릭 * 을 선택합니다. 그런 다음 Grafana 섹션에서 * EC 개요 * 를 선택합니다. Grid EC Job Ec Job Estimated Time to Completion * 및 * Grid EC Job Percentage Completed * 대시보드를 확인합니다.
-
이 명령을 사용하여 특정 의 상태를 확인할 수 있습니다
repair-data
작동:repair-data show-ec-repair-status --repair-id repair ID
-
이 명령을 사용하여 모든 수리를 나열합니다.
repair-data show-ec-repair-status
출력에는 을 포함한 정보가 나열됩니다
repair ID
, 모든 이전 및 현재 실행 중인 수리에 대해 . -
-
출력에 복구 작업이 실패한 것으로 표시되는 경우 를 사용합니다
--repair-id
복구를 재시도하는 옵션입니다.이 명령은 복구 ID 6949309319275667690을 사용하여 장애가 발생한 노드 복구를 재시도합니다.
repair-data start-ec-node-repair --repair-id 6949309319275667690
이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 볼륨 복구를 재시도합니다.
repair-data start-ec-volume-repair --repair-id 6949309319275667690