오브젝트 데이터를 스토리지 볼륨으로 복원(시스템 드라이브 장애)
비어플라이언스 스토리지 노드의 스토리지 볼륨을 복구한 후에는 스토리지 노드에 장애가 발생할 때 손실된 복제 또는 삭제 코딩 오브젝트 데이터를 복구할 수 있습니다.
어떤 절차를 사용해야 합니까?
가능한 경우 그리드 관리자의 * 볼륨 복원 * 페이지를 사용하여 개체 데이터를 복원합니다.
-
볼륨이 * 유지 관리 * > * 볼륨 복원 * > * 에 나열되어 있는 경우 * 복원할 노드 * 는 를 사용하여 오브젝트 데이터를 복원합니다."Grid Manager의 볼륨 복원 페이지"
-
볼륨이 * 유지 관리 * > * 볼륨 복원 * > * 복원할 노드 * 에 표시되지 않으면 스크립트를 사용하여 오브젝트 데이터를 복원하는 다음 단계를 따르십시오.
repair-data
복구된 스토리지 노드에 교체 중인 노드보다 적은 수의 볼륨이 포함된 경우 스크립트를 사용해야
repair-data
합니다.
repair-data 스크립트는 더 이상 사용되지 않으며 향후 릴리즈에서 제거될 예정입니다. 가능하면 를 사용합니다"Grid Manager(그리드 관리자)의 볼륨 복원 절차". |
스크립트를 사용하여 repair-data
객체 데이터를 복원합니다
-
복구된 스토리지 노드의 그리드 관리자의 * nodes * > * Overview * 탭에서 연결 상태가 * Connected * 인 것을 확인했습니다.
개체 복사본을 사용할 수 있도록 그리드의 ILM 규칙이 구성되어 있다고 가정하면 다른 스토리지 노드 또는 클라우드 스토리지 풀에서 오브젝트 데이터를 복원할 수 있습니다.
다음 사항에 유의하십시오.
-
ILM 규칙이 한 개의 복제된 복사본만 저장하도록 구성되었고 해당 복사본이 실패한 스토리지 볼륨에 존재하면 개체를 복구할 수 없습니다.
-
개체의 나머지 복사본만 클라우드 스토리지 풀에 있는 경우 StorageGRID은 오브젝트 데이터를 복원하기 위해 클라우드 스토리지 풀 엔드포인트에 여러 요청을 실행해야 합니다. 이 절차를 수행하기 전에 기술 지원 부서에 문의하여 복구 시간 프레임 및 관련 비용을 추정하십시오.
스크립트 정보를 참조하십시오 repair-data
객체 데이터를 복원하려면 repair-data
스크립트를 실행합니다. 이 스크립트는 개체 데이터 복원 프로세스를 시작하고 ILM 스캔 작업을 통해 ILM 규칙이 충족되는지 확인합니다.
아래의 * 복제 데이터 * 또는 * 삭제 코딩(EC) 데이터 * 를 선택하여 복제된 데이터를 복원하는지 또는 삭제 코딩 데이터를 복원하는지 여부에 따라 스크립트에 대한 다양한 옵션을 repair-data
확인하십시오. 두 유형의 데이터를 모두 복원해야 하는 경우 두 명령 집합을 모두 실행해야 합니다.
스크립트에 대한 자세한 내용을 repair-data 보려면 기본 관리자 노드의 명령줄에서 를 repair-data --help 입력합니다.
|
repair-data 스크립트는 더 이상 사용되지 않으며 향후 릴리즈에서 제거될 예정입니다. 가능하면 를 사용합니다"Grid Manager(그리드 관리자)의 볼륨 복원 절차". |
전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 복제된 데이터를 복원할 수 있습니다.
repair-data start-replicated-node-repair
repair-data start-replicated-volume-repair
다음 명령을 사용하여 복제된 데이터의 복구를 추적할 수 있습니다.
repair-data show-replicated-repair-status
전체 노드를 복구해야 하는지 또는 노드의 특정 볼륨만 복구해야 하는지 여부에 따라 두 가지 명령을 사용하여 삭제 코딩 데이터를 복원할 수 있습니다.
repair-data start-ec-node-repair
repair-data start-ec-volume-repair
다음 명령을 사용하여 삭제 코딩 데이터의 복구를 추적할 수 있습니다.
repair-data show-ec-repair-status
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 하지만 삭제 코딩 데이터를 모두 처리할 수 없는 경우 복구를 완료할 수 없습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
EC 복구 작업은 일시적으로 많은 양의 저장 공간을 예약합니다. 스토리지 알림이 트리거될 수 있지만 복구가 완료되면 문제가 해결됩니다. 예약 저장 공간이 충분하지 않으면 EC 복구 작업이 실패합니다. 작업 실패 또는 성공 여부에 관계없이 EC 복구 작업이 완료되면 저장소 예약이 해제됩니다. |
스토리지 노드의 호스트 이름을 찾습니다
-
기본 관리자 노드에 로그인합니다.
-
다음 명령을 입력합니다.
ssh admin@primary_Admin_Node_IP
-
파일에 나열된 암호를
Passwords.txt
입력합니다. -
다음 명령을 입력하여 루트로 전환합니다.
su -
-
파일에 나열된 암호를
Passwords.txt
입력합니다.루트로 로그인하면 프롬프트가 에서
$
로 `#`변경됩니다.
-
-
파일을 사용하여
/etc/hosts
복구된 스토리지 볼륨에 대한 스토리지 노드의 호스트 이름을 찾습니다. 그리드에 있는 모든 노드의 목록을 보려면 다음을 입력합니다cat /etc/hosts
.
모든 볼륨이 실패한 경우 데이터를 복구합니다
모든 스토리지 볼륨에 장애가 발생한 경우 전체 노드를 복구합니다. 복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 다에 대한 지침을 따르십시오. 복제된 데이터, 삭제 코딩(EC) 데이터 또는 둘 모두를 사용하는지 여부에 따라 달라집니다.
일부 볼륨에만 장애가 발생한 경우 로 이동합니다일부 볼륨만 장애가 발생한 경우 데이터를 복구합니다.
둘 이상의 노드에 대한 작업을 동시에 실행할 수 repair-data 없습니다. 여러 노드를 복구하려면 기술 지원 팀에 문의하십시오.
|
그리드에 복제된 데이터가 포함되어 있는 경우 repair-data start-replicated-node-repair
명령을 옵션(여기서 --nodes
는 호스트 이름(시스템 이름))과 함께 --nodes
사용하여 전체 스토리지 노드를 복구합니다.
이 명령은 SG-DC-SN3이라는 스토리지 노드에서 복제된 데이터를 복구합니다.
repair-data start-replicated-node-repair --nodes SG-DC-SN3
개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없는 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 손실의 원인과 복구가 가능한지 확인해야 합니다. 을 "손실된 개체를 조사합니다"참조하십시오. |
그리드에 삭제 코딩 데이터가 포함되어 있는 경우 명령을 옵션과 함께 --nodes
사용합니다. 여기서 는 호스트 이름(시스템 이름) 옵션을 --nodes
사용하여 repair-data start-ec-node-repair
전체 스토리지 노드를 복구합니다.
이 명령은 이름이 SG-DC-SN3인 스토리지 노드에서 삭제 코딩 데이터를 복구합니다.
repair-data start-ec-node-repair --nodes SG-DC-SN3
이 작업은 이 작업을 식별하는 repair_data
고유 을 repair ID
반환합니다. 이 버튼을 사용하여 repair ID
작업의 진행 상황과 결과를 repair_data
추적합니다. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다.
일부 볼륨만 장애가 발생한 경우 데이터를 복구합니다
일부 볼륨만 장애가 발생한 경우 영향을 받는 볼륨을 복구합니다. 복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 다에 대한 지침을 따르십시오. 복제된 데이터, 삭제 코딩(EC) 데이터 또는 둘 모두를 사용하는지 여부에 따라 달라집니다.
모든 볼륨에 오류가 발생한 경우 로 이동합니다모든 볼륨이 실패한 경우 데이터를 복구합니다.
볼륨 ID를 16진수로 입력합니다. 예를 들어 0000
, 은 첫 번째 볼륨이고 000F
는 16번째 볼륨입니다. 하나의 볼륨, 하나의 볼륨 범위 또는 하나의 시퀀스에 없는 여러 볼륨을 지정할 수 있습니다.
모든 볼륨은 동일한 스토리지 노드에 있어야 합니다. 둘 이상의 스토리지 노드에 대한 볼륨을 복원해야 하는 경우 기술 지원 부서에 문의하십시오.
그리드에 복제된 데이터가 포함되어 있는 경우 start-replicated-volume-repair
명령을 옵션과 함께 --nodes
사용하여 노드를 식별합니다(여기서 --nodes
는 노드의 호스트 이름). 그런 다음 다음 다음 --volumes
예제와 같이 또는 --volume-range
옵션을 추가합니다.
-
단일 볼륨 *: 이 명령은 복제된 데이터를 SG-DC-SN3이라는 스토리지 노드의 볼륨에 복원합니다
0002
.
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002
-
볼륨 범위 *: 이 명령은
0009
SG-DC-SN3이라는 이름의 스토리지 노드에 있는 범위 내의 모든 볼륨에 복제된 데이터를 복원합니다0003
.
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003,0009
*연속되지 않은 여러 볼륨 *: 이 명령은 복제된 데이터를 볼륨, 0005
0008
SG-DC-SN3이라는 스토리지 노드에서 복원합니다. 0001
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008
개체 데이터가 복원되면 StorageGRID 시스템에서 복제된 개체 데이터를 찾을 수 없는 경우 * 개체 손실 * 경고가 트리거됩니다. 시스템 전체의 스토리지 노드에서 경고가 트리거될 수 있습니다. 경고 설명 및 권장 조치를 참고하여 손실의 원인을 파악하고 복구가 가능한지 여부를 확인합니다. |
그리드에 삭제 코딩 데이터가 포함되어 있는 경우 start-ec-volume-repair
명령을 옵션과 함께 --nodes
사용하여 노드를 식별합니다(여기서 --nodes
는 노드의 호스트 이름). 그런 다음 다음 다음 --volumes
예제와 같이 또는 --volume-range
옵션을 추가합니다.
-
단일 볼륨 *: 이 명령은 SG-DC-SN3이라는 이름의 스토리지 노드의 볼륨에 삭제 코딩 데이터를 복원합니다
0007
.
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007
-
볼륨 범위 *: 이 명령은
0006
SG-DC-SN3이라는 이름의 스토리지 노드에 있는 범위 내의 모든 볼륨에 삭제 코딩 데이터를 복원합니다0004
.
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004,0006
*연속되지 않은 여러 볼륨 *: 이 명령은 삭제 코딩 데이터를 볼륨, 000C
000E
SG-DC-SN3이라는 스토리지 노드에서 복원합니다. 000A
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E
`repair-data`이 작업은 이 작업을 식별하는 `repair_data` 고유 을 `repair ID` 반환합니다. 이 버튼을 사용하여 `repair ID` 작업의 진행 상황과 결과를 `repair_data` 추적합니다. 복구 프로세스가 완료되어도 다른 피드백이 반환되지 않습니다.
일부 스토리지 노드가 오프라인인 상태에서 삭제 코딩 데이터 복구를 시작할 수 있습니다. 모든 노드를 사용할 수 있게 되면 복구가 완료됩니다. |
수리 모니터링
복제된 데이터 *, * 삭제 코딩(EC) 데이터 * 또는 둘 모두를 사용하는지 여부에 따라 복구 작업의 상태를 모니터링합니다.
또한 처리 중인 볼륨 복원 작업의 상태를 모니터링하고 에서 완료된 복원 작업의 기록을 볼 수 "그리드 관리자"있습니다.
-
복제된 복구의 예상 완료율을 얻으려면 repair-data 명령에 옵션을 추가합니다
show-replicated-repair-status
.repair-data show-replicated-repair-status
-
수리가 완료되었는지 확인하려면:
-
노드 * > * _ 복구되는 스토리지 노드 _ * > * ILM * 을 선택합니다.
-
평가 섹션의 속성을 검토합니다. 복구가 완료되면 * Awaiting-all * 속성이 0 개체를 나타냅니다.
-
-
수리를 더 자세히 모니터링하려면:
-
지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.
-
복구되는 *GRID * > *_Storage Node _ * > * LDR * > * Data Store * 를 선택합니다.
-
복제된 수리가 완료된 경우 다음 특성을 조합하여 가능한 한 결정합니다.
Cassandra의 일관성이 없을 수 있으며, 복구 실패를 추적하지 않습니다. -
* 시도된 복구(XRPA) : 이 속성을 사용하여 복제된 복구 진행률을 추적합니다. 이 속성은 스토리지 노드가 고위험 객체를 복구하려고 할 때마다 증가합니다. 이 속성이 현재 스캔 기간( Scan Period — Estimated* 속성 제공)보다 더 긴 기간 동안 증가하지 않으면 ILM 스캐닝에서 모든 노드에서 복구해야 할 고위험 개체를 찾지 못한 것입니다.
고위험 개체는 완전히 손실될 위험이 있는 개체입니다. ILM 구성을 충족하지 않는 개체는 포함되지 않습니다. -
* 스캔 기간 — 예상(XSCM) *: 이 속성을 사용하여 이전에 수집된 개체에 정책 변경이 적용되는 시점을 추정합니다. 복구 시도 * 속성이 현재 스캔 기간보다 긴 기간 동안 증가하지 않으면 복제된 수리가 수행될 수 있습니다. 스캔 기간은 변경될 수 있습니다. 스캔 기간 — 예상(XSCM) * 속성은 전체 그리드에 적용되며 모든 노드 스캔 기간의 최대값입니다. 그리드에 대한 * Scan Period — Estimated * 속성 기록을 조회하여 적절한 기간을 결정할 수 있습니다.
-
-
삭제 코딩 데이터의 복구를 모니터링하고 실패한 요청을 다시 시도하려면 다음을 수행하십시오.
-
삭제 코딩 데이터 복구 상태를 확인합니다.
-
현재 작업의 예상 완료 시간과 완료 비율을 보려면 * 지원 * > * 도구 * > * 메트릭 * 을 선택합니다. 그런 다음 Grafana 섹션에서 * EC 개요 * 를 선택합니다. Grid EC Job Ec Job Estimated Time to Completion * 및 * Grid EC Job Percentage Completed * 대시보드를 확인합니다.
-
다음 명령을 사용하여 특정 작업의 상태를
repair-data
확인합니다.repair-data show-ec-repair-status --repair-id repair ID
-
이 명령을 사용하여 모든 수리를 나열합니다.
repair-data show-ec-repair-status
출력에는 이전 및 현재 실행 중인 모든 수리에 대한 정보가
repair ID
표시됩니다. -
-
출력에 복구 작업이 실패했다고 표시되는 경우 옵션을 사용하여
--repair-id
복구를 재시도합니다.이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 노드 복구를 재시도합니다.
repair-data start-ec-node-repair --repair-id 6949309319275667690
이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 볼륨 복구를 다시 시도합니다.
repair-data start-ec-volume-repair --repair-id 6949309319275667690