본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

연결이 끊긴 그리드 노드의 서비스 해제

11/07/2024 기여자

PDF

현재 그리드에 연결되어 있지 않은 노드(상태가 알 수 없거나 관리상 중단된 노드)를 해제해야 할 수 있습니다.

시작하기 전에

서비스 해제 시 고려 사항 및 서비스 해제 시 고려 "관리자 및 게이트웨이 노드""스토리지 노드"사항을 이해합니다.
모든 필수 항목을 확보했습니다.
활성화된 데이터 복구 작업이 없도록 했습니다. 을 "데이터 복구 작업을 확인합니다"참조하십시오.
스토리지 노드 복구가 그리드의 어느 곳에서든 진행되고 있지 않음을 확인했습니다. 있는 경우 복구 과정에서 Cassandra 재구축이 완료될 때까지 기다려야 합니다. 그런 다음 해체 작업을 진행할 수 있습니다.
노드 서비스 해제 절차가 일시 중지되지 않는 한 노드 서비스 해제 절차가 실행되는 동안 다른 유지 보수 절차가 실행되지 않도록 했습니다.
서비스 해제하려는 연결이 끊긴 노드 또는 노드에 대한 * 서비스 해제 가능 * 열에 녹색 확인 표시가 포함됩니다.
프로비저닝 암호가 있습니다.

이 작업에 대해

Health* 열에서 파란색 Unknown 아이콘 또는 회색 Administratively Down 아이콘을 아이콘 사용자 다운 찾아 연결이 끊어진 노드를 식별할 수 알 수 없는 아이콘 있습니다.

분리된 노드를 폐기하기 전에 다음 사항에 유의하십시오.

이 절차는 주로 연결이 끊긴 단일 노드를 제거하기 위한 것입니다. 그리드에 연결이 끊어진 노드가 여러 개 포함된 경우, 소프트웨어를 동시에 모두 해제해야 예기치 않은 결과가 발생할 가능성이 높아집니다.

연결이 끊긴 스토리지 노드를 한 번에 두 개 이상 해제하는 경우 데이터가 손실될 수 있습니다. 을 "연결이 끊어진 스토리지 노드에 대한 고려 사항"참조하십시오.

소프트웨어 기반 메타데이터 전용 노드가 포함된 그리드에서 스토리지 노드를 해제할 때는 주의하십시오. store_both_objects 및 메타데이터로 구성된 모든 노드를 해제하면 그리드에서 객체를 저장하는 기능이 제거됩니다. 메타데이터 전용 스토리지 노드에 대한 자세한 내용은 을 "스토리지 노드 유형"참조하십시오.

연결이 끊긴 노드를 제거할 수 없는 경우(예: ADC 쿼럼에 필요한 스토리지 노드) 연결이 끊긴 다른 노드는 제거할 수 없습니다.

단계

아카이브 노드(연결 해제되어야 함)를 해제하지 않는 한 연결이 끊어진 그리드 노드를 다시 온라인 상태로 전환하거나 복구해 보십시오.

자세한 내용은 을 "그리드 노드 복구 절차" 참조하십시오.

연결이 끊긴 그리드 노드를 복구할 수 없고 연결이 끊긴 동안 노드 서비스를 해제하려면 해당 노드에 대한 확인란을 선택합니다.

그리드에 연결이 끊어진 노드가 여러 개 포함된 경우, 소프트웨어를 동시에 모두 해제해야 예기치 않은 결과가 발생할 가능성이 높아집니다.

연결이 끊긴 여러 스토리지 노드를 선택하는 경우, 한 번에 둘 이상의 그리드 노드 해제를 선택할 때는 특히 주의하십시오. 복구할 수 없는 스토리지 노드가 두 개 이상 연결되어 있는 경우 기술 지원 부서에 문의하여 최상의 조치를 취하십시오.

프로비저닝 암호를 입력합니다.

서비스 해제 시작 * 버튼이 활성화됩니다.
서비스 해제 시작 * 을 클릭합니다.

연결이 끊긴 노드를 선택했으며 노드에 개체의 복사본만 있는 경우 개체 데이터가 손실된다는 경고가 나타납니다.
노드 목록을 검토하고 * OK * 를 클릭합니다.

서비스 해제 절차가 시작되고 각 노드에 대한 진행률이 표시됩니다. 절차 중에 그리드 구성 변경을 포함하는 새 복구 패키지가 생성됩니다.

새 복구 패키지를 사용할 수 있게 되면 링크를 클릭하거나 * 유지보수 * > * 시스템 * > * 복구 패키지 * 를 선택하여 복구 패키지 페이지에 액세스합니다. 그런 다음 .zip 파일을 다운로드합니다.

의 지침을 "복구 패키지 다운로드 중"참조하십시오.

서비스 해제 절차 중에 문제가 발생할 경우 그리드를 복구할 수 있도록 가능한 한 빨리 복구 패키지를 다운로드하십시오.

복구 패키지 파일은 StorageGRID 시스템에서 데이터를 가져오는 데 사용할 수 있는 암호화 키와 암호가 포함되어 있으므로 보안을 유지해야 합니다.

서비스 해제 페이지를 주기적으로 모니터링하여 선택한 모든 노드가 성공적으로 폐기되었는지 확인합니다.

스토리지 노드의 사용을 해제하는 데 며칠 또는 몇 주가 걸릴 수 있습니다. 모든 작업이 완료되면 노드 선택 목록이 성공 메시지와 함께 다시 표시됩니다. 분리된 스토리지 노드를 폐기한 경우 복구 작업이 시작되었다는 정보 메시지가 표시됩니다.
서비스 해제 절차의 일부로 노드가 자동으로 종료된 후 나머지 가상 머신 또는 사용 중지된 노드와 관련된 기타 리소스를 제거합니다.

노드가 자동으로 종료될 때까지 이 단계를 수행하지 마십시오.
스토리지 노드를 폐기하는 경우 서비스 해제 프로세스 중에 자동으로 시작되는 * 복제된 데이터 * 및 * 삭제 코딩(EC) 데이터 * 복구 작업의 상태를 모니터링합니다.

복제된 데이터

복제된 복구의 예상 완료율을 얻으려면 repair-data 명령에 옵션을 추가합니다 show-replicated-repair-status.

repair-data show-replicated-repair-status
수리가 완료되었는지 확인하려면:
1. 노드 * > * _ 복구되는 스토리지 노드 _ * > * ILM * 을 선택합니다.
2. 평가 섹션의 속성을 검토합니다. 복구가 완료되면 * Awaiting-all * 속성이 0 개체를 나타냅니다.
수리를 더 자세히 모니터링하려면:
1. 지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.
2. 복구되는 *GRID * > *_Storage Node _ * > * LDR * > * Data Store * 를 선택합니다.
3. 복제된 수리가 완료된 경우 다음 특성을 조합하여 가능한 한 결정합니다.
  
  Cassandra의 일관성이 없을 수 있으며, 복구 실패를 추적하지 않습니다.
  - * 시도된 복구(XRPA) : 이 속성을 사용하여 복제된 복구 진행률을 추적합니다. 이 속성은 스토리지 노드가 고위험 객체를 복구하려고 할 때마다 증가합니다. 이 속성이 현재 스캔 기간( Scan Period — Estimated* 속성 제공)보다 더 긴 기간 동안 증가하지 않으면 ILM 스캐닝에서 모든 노드에서 복구해야 할 고위험 개체를 찾지 못한 것입니다.
    
    고위험 개체는 완전히 손실될 위험이 있는 개체입니다. ILM 구성을 충족하지 않는 개체는 포함되지 않습니다.
  - * 스캔 기간 — 예상(XSCM) *: 이 속성을 사용하여 이전에 수집된 개체에 정책 변경이 적용되는 시점을 추정합니다. 복구 시도 * 속성이 현재 스캔 기간보다 긴 기간 동안 증가하지 않으면 복제된 수리가 수행될 수 있습니다. 스캔 기간은 변경될 수 있습니다. 스캔 기간 — 예상(XSCM) * 속성은 전체 그리드에 적용되며 모든 노드 스캔 기간의 최대값입니다. 그리드에 대한 * Scan Period — Estimated * 속성 기록을 조회하여 적절한 기간을 결정할 수 있습니다.

삭제 코딩(EC) 데이터

삭제 코딩 데이터의 복구를 모니터링하고 실패한 요청을 다시 시도하려면 다음을 수행하십시오.

삭제 코딩 데이터 복구 상태를 확인합니다.
- 현재 작업의 예상 완료 시간과 완료 비율을 보려면 * 지원 * > * 도구 * > * 메트릭 * 을 선택합니다. 그런 다음 Grafana 섹션에서 * EC 개요 * 를 선택합니다. Grid EC Job Ec Job Estimated Time to Completion * 및 * Grid EC Job Percentage Completed * 대시보드를 확인합니다.
- 다음 명령을 사용하여 특정 작업의 상태를 repair-data 확인합니다.
  
  repair-data show-ec-repair-status --repair-id repair ID
- 이 명령을 사용하여 모든 수리를 나열합니다.
  
  repair-data show-ec-repair-status
출력에는 이전 및 현재 실행 중인 모든 수리에 대한 정보가 repair ID 표시됩니다.
출력에 복구 작업이 실패했다고 표시되는 경우 옵션을 사용하여 --repair-id 복구를 재시도합니다.

이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 노드 복구를 재시도합니다.

repair-data start-ec-node-repair --repair-id 6949309319275667690

이 명령은 복구 ID 6949309319275667690을 사용하여 실패한 볼륨 복구를 다시 시도합니다.

repair-data start-ec-volume-repair --repair-id 6949309319275667690

작업을 마친 후

연결이 끊긴 노드를 폐기하고 모든 데이터 복구 작업이 완료되는 즉시 연결된 모든 그리드 노드를 필요에 따라 해제할 수 있습니다.

그런 다음 서비스 해제 절차를 완료한 후 다음 단계를 완료합니다.

해체된 그리드 노드의 드라이브가 깨끗하게 지워졌는지 확인합니다. 상용 데이터 삭제 도구 또는 서비스를 사용하여 드라이브에서 데이터를 영구적으로 안전하게 제거합니다.
어플라이언스 노드를 폐기했고 어플라이언스의 데이터가 노드 암호화를 사용하여 보호된 경우 StorageGRID 어플라이언스 설치 프로그램을 사용하여 키 관리 서버 구성을 지웁니다(KMS 지우기). 다른 그리드에 어플라이언스를 추가하려면 KMS 구성을 지워야 합니다. 자세한 내용은 을 "유지보수 모드에서 노드 암호화를 모니터링합니다"참조하십시오.

연결이 끊긴 그리드 노드의 서비스 해제

Creating your file...