어플라이언스의 스토리지 볼륨에 오브젝트 데이터를 복원합니다
어플라이언스 스토리지 노드의 스토리지 볼륨을 복구한 후에는 스토리지 노드에 장애가 발생할 때 손실된 복제 또는 삭제 코딩 오브젝트 데이터를 복원할 수 있습니다.
어떤 절차를 사용해야 합니까?
가능한 경우 그리드 관리자의 * 볼륨 복원 * 페이지를 사용하여 개체 데이터를 복원합니다.
-
볼륨이 유지 관리 > 볼륨 복원 > *복원할 노드*에 나열된 경우 다음을 사용하여 개체 데이터를 복원합니다."Grid Manager의 볼륨 복원 페이지" .
-
볼륨이 유지 관리 > 볼륨 복원 > *복원할 노드*에 나열되지 않은 경우 아래 단계에 따라 사용하십시오.
repair-data객체 데이터를 복원하는 스크립트입니다.복구된 스토리지 노드에 교체 중인 노드보다 적은 수의 볼륨이 포함된 경우 스크립트를 사용해야
repair-data합니다.
|
|
repair-data 스크립트는 더 이상 사용되지 않으며 향후 릴리즈에서 제거될 예정입니다. 가능하면 를 사용합니다"Grid Manager(그리드 관리자)의 볼륨 복원 절차". |
스크립트를 사용하여 repair-data 객체 데이터를 복원합니다
-
복구된 스토리지 노드의 연결 상태가 연결됨*임을 확인했습니다.
그리드 관리자의 *노드 > 개요 탭.
개체 복사본을 사용할 수 있도록 그리드의 ILM 규칙이 구성되어 있다고 가정하면 다른 스토리지 노드 또는 클라우드 스토리지 풀에서 오브젝트 데이터를 복원할 수 있습니다.
다음 사항에 유의하십시오.
-
ILM 규칙이 한 개의 복제된 복사본만 저장하도록 구성되었고 해당 복사본이 실패한 스토리지 볼륨에 존재하면 개체를 복구할 수 없습니다.
-
개체의 나머지 복사본만 클라우드 스토리지 풀에 있는 경우 StorageGRID은 오브젝트 데이터를 복원하기 위해 클라우드 스토리지 풀 엔드포인트에 여러 요청을 실행해야 합니다. 이 절차를 수행하기 전에 기술 지원 부서에 문의하여 복구 시간 프레임 및 관련 비용을 추정하십시오.
스크립트 정보를 참조하십시오 repair-data
객체 데이터를 복원하려면 repair-data 스크립트를 실행합니다. 이 스크립트는 개체 데이터 복원 프로세스를 시작하고 ILM 스캔 작업을 통해 ILM 규칙이 충족되는지 확인합니다.
아래의 * 복제 데이터 * 또는 * 삭제 코딩(EC) 데이터 * 를 선택하여 복제된 데이터를 복원하는지 또는 삭제 코딩 데이터를 복원하는지 여부에 따라 스크립트에 대한 다양한 옵션을 repair-data 확인하십시오. 두 유형의 데이터를 모두 복원해야 하는 경우 두 명령 집합을 모두 실행해야 합니다.
|
|
스크립트에 대한 자세한 내용을 repair-data 보려면 기본 관리자 노드의 명령줄에서 를 repair-data --help 입력합니다.
|
|
|
repair-data 스크립트는 더 이상 사용되지 않으며 향후 릴리즈에서 제거될 예정입니다. 가능하면 를 사용합니다"Grid Manager(그리드 관리자)의 볼륨 복원 절차". |
전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 복제된 데이터를 복원할 수 있습니다.
repair-data start-replicated-node-repair
repair-data start-replicated-volume-repair
다음 명령을 사용하여 복제된 데이터의 복구를 추적할 수 있습니다.
repair-data show-replicated-repair-status
전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 삭제 코딩 데이터를 복원할 수 있습니다.
repair-data start-ec-node-repair
repair-data start-ec-volume-repair
다음 명령을 사용하여 삭제 코딩 데이터의 복구를 추적할 수 있습니다.
repair-data show-ec-repair-status
|
|
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 하지만 삭제 코딩 데이터를 모두 처리할 수 없는 경우 복구를 완료할 수 없습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
|
|
EC 복구 작업은 일시적으로 많은 양의 저장 공간을 예약합니다. 스토리지 알림이 트리거될 수 있지만 복구가 완료되면 문제가 해결됩니다. 예약 저장 공간이 충분하지 않으면 EC 복구 작업이 실패합니다. 작업 실패 또는 성공 여부에 관계없이 EC 복구 작업이 완료되면 저장소 예약이 해제됩니다. |
스토리지 노드의 호스트 이름을 찾습니다
-
모든 관리 노드에 로그인하세요.
-
다음 명령을 입력합니다.
ssh admin@primary_Admin_Node_IP -
파일에 나열된 암호를
Passwords.txt입력합니다. -
다음 명령을 입력하여 루트로 전환합니다.
su - -
파일에 나열된 암호를
Passwords.txt입력합니다.루트로 로그인하면 프롬프트가 에서
$로 `#`변경됩니다.
-
-
파일을 사용하여
/etc/hosts복구된 스토리지 볼륨에 대한 스토리지 노드의 호스트 이름을 찾습니다. 그리드에 있는 모든 노드의 목록을 보려면 다음을 입력합니다cat /etc/hosts.
모든 볼륨이 실패한 경우 데이터를 복구합니다
모든 스토리지 볼륨에 장애가 발생한 경우 전체 노드를 복구합니다. 복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 다에 대한 지침을 따르십시오. 복제된 데이터, 삭제 코딩(EC) 데이터 또는 둘 모두를 사용하는지 여부에 따라 달라집니다.
일부 볼륨에만 장애가 발생한 경우 로 이동합니다일부 볼륨만 장애가 발생한 경우 데이터를 복구합니다.
|
|
둘 이상의 노드에 대한 작업을 동시에 실행할 수 repair-data 없습니다. 여러 노드를 복구하려면 기술 지원 팀에 문의하십시오.
|
그리드에 복제된 데이터가 포함되어 있는 경우 repair-data start-replicated-node-repair 명령을 옵션(여기서 --nodes 는 호스트 이름(시스템 이름))과 함께 --nodes 사용하여 전체 스토리지 노드를 복구합니다.
이 명령은 SG-DC-SN3이라는 스토리지 노드에서 복제된 데이터를 복구합니다.
repair-data start-replicated-node-repair --nodes SG-DC-SN3
|
|
개체 데이터가 복원되면 StorageGRID 시스템이 복제된 개체 데이터를 찾을 수 없는 경우 개체 손실 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 발생할 수 있습니다. 손실의 원인을 파악하고 회복이 가능한지 확인해야 합니다. 보다 "분실 가능성이 있는 물건을 조사하세요" . |
그리드에 삭제 코딩 데이터가 포함되어 있는 경우 명령을 옵션과 함께 --nodes 사용합니다. 여기서 는 호스트 이름(시스템 이름) 옵션을 --nodes 사용하여 repair-data start-ec-node-repair 전체 스토리지 노드를 복구합니다.
이 명령은 이름이 SG-DC-SN3인 스토리지 노드에서 삭제 코딩 데이터를 복구합니다.
repair-data start-ec-node-repair --nodes SG-DC-SN3
이 작업은 이 작업을 식별하는 repair_data 고유 을 repair ID 반환합니다. 이 버튼을 사용하여 repair ID 작업의 진행 상황과 결과를 repair_data 추적합니다. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다.
일부 볼륨만 장애가 발생한 경우 데이터를 복구합니다
일부 볼륨만 장애가 발생한 경우 영향을 받는 볼륨을 복구합니다. 복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 다에 대한 지침을 따르십시오. 복제된 데이터, 삭제 코딩(EC) 데이터 또는 둘 모두를 사용하는지 여부에 따라 달라집니다.
모든 볼륨에 오류가 발생한 경우 로 이동합니다모든 볼륨이 실패한 경우 데이터를 복구합니다.
볼륨 ID를 16진수로 입력합니다. 예를 들어 0000, 은 첫 번째 볼륨이고 000F 는 16번째 볼륨입니다. 하나의 볼륨, 하나의 볼륨 범위 또는 하나의 시퀀스에 없는 여러 볼륨을 지정할 수 있습니다.
모든 볼륨은 동일한 스토리지 노드에 있어야 합니다. 둘 이상의 스토리지 노드에 대한 볼륨을 복원해야 하는 경우 기술 지원 부서에 문의하십시오.
그리드에 복제된 데이터가 포함되어 있는 경우 start-replicated-volume-repair 명령을 옵션과 함께 --nodes 사용하여 노드를 식별합니다(여기서 --nodes 는 노드의 호스트 이름). 그런 다음 다음 다음 --volumes 예제와 같이 또는 --volume-range 옵션을 추가합니다.
-
단일 볼륨 *: 이 명령은 복제된 데이터를 SG-DC-SN3이라는 스토리지 노드의 볼륨에 복원합니다
0002.
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002
-
볼륨 범위 *: 이 명령은
0009SG-DC-SN3이라는 이름의 스토리지 노드에 있는 범위 내의 모든 볼륨에 복제된 데이터를 복원합니다0003.
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003,0009
*연속되지 않은 여러 볼륨 *: 이 명령은 복제된 데이터를 볼륨, 0005 0008 SG-DC-SN3이라는 스토리지 노드에서 복원합니다. 0001
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008
|
|
개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없는 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 경고 설명 및 권장 조치를 참고하여 손실의 원인을 파악하고 복구가 가능한지 여부를 확인합니다. |
그리드에 삭제 코딩 데이터가 포함되어 있는 경우 start-ec-volume-repair 명령을 옵션과 함께 --nodes 사용하여 노드를 식별합니다(여기서 --nodes 는 노드의 호스트 이름). 그런 다음 다음 다음 --volumes 예제와 같이 또는 --volume-range 옵션을 추가합니다.
-
단일 볼륨 *: 이 명령은 SG-DC-SN3이라는 이름의 스토리지 노드의 볼륨에 삭제 코딩 데이터를 복원합니다
0007.
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007
-
볼륨 범위 *: 이 명령은
0006SG-DC-SN3이라는 이름의 스토리지 노드에 있는 범위 내의 모든 볼륨에 삭제 코딩 데이터를 복원합니다0004.
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004,0006
*연속되지 않은 여러 볼륨 *: 이 명령은 삭제 코딩 데이터를 볼륨, 000C 000E SG-DC-SN3이라는 스토리지 노드에서 복원합니다. 000A
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E
`repair-data`이 작업은 이 작업을 식별하는 `repair_data` 고유 을 `repair ID` 반환합니다. 이 버튼을 사용하여 `repair ID` 작업의 진행 상황과 결과를 `repair_data` 추적합니다. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.
|
|
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
수리 모니터링
복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 모두를 사용하는지 여부에 따라 복구 작업의 상태를 모니터링합니다.
또한 처리 중인 볼륨 복원 작업의 상태를 모니터링하고 에서 완료된 복원 작업의 기록을 볼 수 "그리드 관리자"있습니다.
-
복제된 복구의 예상 완료율을 얻으려면 repair-data 명령에 옵션을 추가합니다
show-replicated-repair-status.repair-data show-replicated-repair-status -
수리가 완료되었는지 확인하려면:
-
노드 > 수리 중인 스토리지 노드 > *ILM*을 선택합니다.
-
평가 섹션의 속성을 검토합니다. 복구가 완료되면 * Awaiting-all * 속성이 0 개체를 나타냅니다.
-
-
수리를 더 자세히 모니터링하려면:
-
*노드*를 선택하세요.
-
GRID NAME * > * ILM * 을 선택합니다.
-
ILM 대기열 그래프 위에 커서를 놓으면 스캔 속도(객체/초) 속성 값을 볼 수 있습니다. 스캔 속도(객체/초)는 그리드에 있는 객체가 ILM을 위해 스캔되고 대기열에 추가되는 속도입니다.
-
ILM 대기열 섹션에서 다음 속성을 살펴보세요.
-
* 스캔 기간 - 추정 * : 모든 개체의 전체 ILM 스캔을 완료하는 데 걸리는 예상 시간입니다.
전체 검사를 수행해도 ILM이 모든 개체에 적용되었다는 보장은 없습니다.
-
시도된 복구: 위험도가 높은 것으로 간주되는 복제된 데이터에 대해 시도된 총 개체 복구 작업 수입니다. 고위험 객체는 ILM 정책에 의해 지정되었거나 사본이 분실되어 사본이 하나만 남아 있는 모든 객체를 말합니다. 이 수는 스토리지 노드가 고위험 객체를 복구하려고 할 때마다 증가합니다. 전력망이 혼잡해지면 위험성이 높은 ILM 수리가 우선시됩니다.
복구 후 복제가 실패하면 동일한 개체 복구가 다시 증가할 수 있습니다. + 이러한 속성은 스토리지 노드 볼륨 복구 진행 상황을 모니터링할 때 유용할 수 있습니다. 수리 시도 횟수가 더 이상 증가하지 않고 전체 검사가 완료되면 수리가 완료된 것으로 추정됩니다.
-
-
또는 Prometheus 쿼리를 제출하세요.
storagegrid_ilm_scan_period_estimated_minutes그리고storagegrid_ilm_repairs_attempted.
-
삭제 코딩 데이터의 복구를 모니터링하고 실패한 요청을 다시 시도하려면 다음을 수행하십시오.
-
삭제 코딩 데이터 복구 상태를 확인합니다.
-
지원 > 도구 > 측정항목*을 선택하면 현재 작업에 대한 예상 완료 시간과 완료율을 볼 수 있습니다. 그런 다음 Grafana 섹션에서 *EC 개요*를 선택합니다. *Grid EC 작업 예상 완료 시간 및 Grid EC 작업 완료율 대시보드를 살펴보세요.
-
다음 명령을 사용하여 특정 작업의 상태를
repair-data확인합니다.repair-data show-ec-repair-status --repair-id repair ID -
이 명령을 사용하여 모든 수리를 나열합니다.
repair-data show-ec-repair-status
출력에는 이전 및 현재 실행 중인 모든 수리에 대한 정보가
repair ID표시됩니다. -
-
출력에 복구 작업이 실패했다고 표시되는 경우 옵션을 사용하여
--repair-id복구를 재시도합니다.이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 노드 복구를 재시도합니다.
repair-data start-ec-node-repair --repair-id 6949309319275667690이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 볼륨 복구를 다시 시도합니다.
repair-data start-ec-volume-repair --repair-id 6949309319275667690