본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

StorageGRID로 제로 RPO 달성 - 멀티 사이트 복제에 대한 포괄적인 가이드

07/09/2026 기여자

이 기술 보고서는 사이트 장애 발생 시 복구 지점 목표(RPO)를 0으로 달성하기 위해 StorageGRID 복제 전략을 구현하는 방법에 대한 포괄적인 가이드를 제공합니다. 이 문서에서는 다중 사이트 동기 복제 및 다중 그리드 비동기 복제를 포함하여 StorageGRID 에 대한 다양한 배포 옵션에 대해 자세히 설명합니다. 여기서는 StorageGRID 정보 수명 주기 관리(ILM) 정책을 구성하여 여러 위치에서 데이터 내구성과 가용성을 보장하는 방법을 설명합니다. 또한 이 보고서는 중단 없는 클라이언트 운영을 유지하기 위한 성능 고려 사항, 실패 시나리오 및 복구 프로세스도 다룹니다. 이 문서의 목적은 동기 및 비동기 복제 기술을 모두 활용하여 사이트 전체에 장애가 발생한 경우에도 데이터에 대한 접근 가능성과 일관성을 유지하는 데 필요한 정보를 제공하는 것입니다.

StorageGRID 개요

NetApp StorageGRID는 업계 표준 Amazon S3(Amazon Simple Storage Service) API를 지원하는 오브젝트 기반 스토리지 시스템입니다.

StorageGRID는 정보 라이프사이클 관리 정책(ILM)에 따라 다양한 서비스 수준의 단일 네임스페이스를 여러 위치에서 제공합니다. 이러한 수명 주기 정책을 사용하면 수명 주기 전반에 걸쳐 데이터가 저장되는 위치를 최적화할 수 있습니다.

StorageGRID은 로컬 및 지리적으로 분산된 솔루션에서 구성 가능한 내구성과 데이터 가용성을 지원합니다. 데이터가 온프레미스에 있든 퍼블릭 클라우드에 있든, 통합 하이브리드 클라우드 워크플로를 통해 기업은 Amazon Simple Notification Service(Amazon SNS), Google Cloud, Microsoft Azure Blob, Amazon S3 Glacier, Elasticsearch 등의 클라우드 서비스를 활용할 수 있습니다.

StorageGRID 확장

최소 StorageGRID 배포는 단일 사이트의 관리 노드와 3개의 스토리지 노드로 구성됩니다. 단일 그리드는 최대 220개 노드까지 확장될 수 있습니다. StorageGRID 단일 사이트로 배포하거나 16개 사이트로 확장할 수 있습니다.

관리 노드에는 측정 항목과 로깅을 위한 중앙 지점인 관리 인터페이스가 포함되어 있으며 StorageGRID 구성 요소의 구성을 유지 관리합니다. 관리자 노드에는 S3 API 액세스를 위한 통합 로드 밸런서도 포함되어 있습니다.

StorageGRID 소프트웨어 전용, VMware 가상 머신 어플라이언스 또는 특수 목적 어플라이언스로 배포할 수 있습니다.

스토리지 노드는 다음과 같이 배포될 수 있습니다.

객체 수를 최대화하는 메타데이터 전용 노드
객체 공간을 극대화하는 객체 스토리지 전용 노드
객체 수와 객체 공간을 모두 추가하는 결합된 메타데이터 및 객체 스토리지 노드

각 스토리지 노드는 수백 페타바이트 규모의 단일 네임스페이스를 허용하는 객체 스토리지의 멀티 페타바이트 용량으로 확장될 수 있습니다. StorageGRID 게이트웨이 노드라고 하는 S3 API 작업을 위한 통합 로드 밸런서도 제공합니다.

StorageGRID 구축 옵션

StorageGRID 사이트 토폴로지에 배치된 노드 컬렉션으로 구성됩니다. StorageGRID 의 사이트는 고유한 물리적 위치일 수도 있고, 논리적 구조로 그리드의 다른 사이트와 공유되는 물리적 위치에 상주할 수도 있습니다. StorageGRID 사이트는 여러 물리적 위치에 걸쳐 있어서는 안 됩니다. 사이트는 공유된 LAN(Local Area Network) 인프라와 장애 도메인을 나타냅니다.

StorageGRID 및 장애 도메인

StorageGRID에는 장애 위험을 완화하기 위해 솔루션 설계 방법, 데이터 저장 방법 및 데이터 저장 위치를 결정할 때 고려해야 할 여러 계층의 장애 도메인이 포함되어 있습니다.

그리드 수준 - 여러 사이트로 구성된 그리드는 사이트 장애 또는 격리를 가질 수 있으며 액세스 가능한 사이트는 그리드로 계속 작동할 수 있습니다.
사이트 수준 - 사이트 내의 장애가 발생하면 해당 사이트의 운영에 영향을 줄 수 있지만 나머지 그리드에는 영향을 주지 않습니다.
노드 레벨 - 노드 장애는 사이트 운영에 영향을 미치지 않습니다.
디스크 레벨 - 디스크 장애는 노드 작동에 영향을 주지 않습니다.

오브젝트 데이터 및 메타데이터

오브젝트 스토리지의 경우, 스토리지 단위는 파일 또는 블록이 아닌 오브젝트입니다. 파일 시스템 또는 블록 스토리지의 트리와 같은 계층구조와 달리 오브젝트 스토리지는 데이터를 구조화되지 않은 단순 레이아웃으로 구성합니다. 오브젝트 스토리지는 데이터의 물리적 위치를 해당 데이터를 저장하고 검색하는 데 사용되는 메서드에서 분리합니다.

오브젝트 기반 스토리지 시스템의 각 오브젝트에는 오브젝트 데이터와 오브젝트 메타데이터의 두 부분이 있습니다.

객체 데이터는 실제 기본 데이터를 나타냅니다. 예를 들어 사진, 영화, 의료 기록 등이 있습니다.
개체 메타데이터는 개체를 설명하는 정보입니다.

StorageGRID는 오브젝트 메타데이터를 사용하여 그리드 전체의 모든 오브젝트의 위치를 추적하고 각 오브젝트의 라이프사이클 관리를 제공합니다.

오브젝트 메타데이터에는 다음과 같은 정보가 포함됩니다.

각 개체의 고유 ID, 개체 이름, S3 버킷 이름, 테넌트 계정 이름 또는 ID, 개체의 논리적 크기, 개체가 처음 생성된 날짜 및 시간, 개체가 마지막으로 수정된 날짜 및 시간을 포함한 시스템 메타데이터입니다.
각 객체의 복제본 사본이나 삭제 코드화된 조각의 현재 저장 위치입니다.
객체와 연결된 모든 사용자 메타데이터 키 값 쌍입니다.
S3 오브젝트의 경우 오브젝트와 연결된 모든 오브젝트 태그 키-값 쌍입니다
세그먼트화된 객체와 다중 파트 객체의 경우 세그먼트 식별자와 데이터 크기입니다.

개체 메타데이터는 사용자 지정이 가능하며 확장이 가능하므로 응용 프로그램에서 유연하게 사용할 수 있습니다. StorageGRID에서 오브젝트 메타데이터를 저장하는 방법과 위치에 대한 자세한 내용은 를 참조하십시오 "오브젝트 메타데이터 스토리지 관리".

StorageGRID의 ILM(정보 라이프사이클 관리) 시스템은 StorageGRID 시스템의 모든 오브젝트 데이터에 대한 배치, 기간 및 수집 동작을 조정하는 데 사용됩니다. ILM 규칙은 StorageGRID에서 오브젝트의 복제본을 사용하거나 노드 및 사이트 간에 오브젝트를 삭제 코딩하여 시간에 따라 저장하는 방식을 결정합니다. 이 ILM 시스템은 그리드 내의 객체 데이터 일관성을 담당합니다.

삭제 코딩

StorageGRID 노드 수준과 드라이브 수준에서 코드 데이터를 지우는 기능을 제공합니다. StorageGRID 어플라이언스를 사용하면 노드 내의 모든 드라이브에 저장된 데이터의 삭제 코드를 작성하여 여러 디스크 장애로 인한 데이터 손실이나 중단으로부터 로컬 보호를 제공합니다. 드라이브 장애로 인한 재구축은 노드에 국한되므로 네트워크를 통해 데이터를 복제할 필요가 없습니다.

또한 StorageGRID 어플라이언스는 StorageGRID의 ILM 규칙을 통해 노드 장애로부터 보호하면서, 삭제 코딩 방식을 사용하여 사이트 내의 노드 전체 또는 StorageGRID 시스템의 3개 이상의 사이트에 걸쳐 개체 데이터를 저장합니다.

삭제 코딩은 복제보다 오버헤드가 낮으면서 노드 및 사이트 장애에 대한 복원력이 뛰어난 스토리지 레이아웃을 제공합니다. 모든 StorageGRID 삭제 코딩 체계는 데이터 청크를 저장하는 데 필요한 최소 노드 수가 충족되는 경우 단일 사이트에 배포할 수 있습니다. 즉, 4+2의 EC 체계에서는 데이터를 수신할 수 있는 노드가 최소 6개 있어야 합니다.

오브젝트에 대해 사용 가능한 StorageGRID 삭제 코딩 체계

메타데이터 정합성

StorageGRID에서 메타데이터는 일반적으로 사이트당 3개의 복제본으로 저장되므로 정합성 보장 및 가용성이 보장됩니다. 이러한 중복성은 장애가 발생한 경우에도 데이터 무결성과 접근성을 유지할 수 있도록 도와줍니다.

기본 일관성은 그리드 전체에서 정의됩니다. 사용자는 언제든지 버킷 수준에서 일관성을 변경할 수 있습니다.

StorageGRID에서 사용할 수 있는 버킷 일관성 옵션은 다음과 같습니다.

* 모두 *: 최고 수준의 일관성을 제공합니다. 그리드의 모든 노드가 즉시 데이터를 수신하면 요청이 실패합니다.
강력한 글로벌:
- 레거시 스트롱 글로벌: 모든 사이트의 모든 클라이언트 요청에 대해 읽기-쓰기 일관성을 보장합니다.
  - 이는 새로운 Quorum Strong Global로 수동으로 변경하지 않고도 11.9 이하 버전에서 12.0으로 업그레이드한 모든 시스템에 적용되는 기본 동작입니다.
- Quorum Strong-global: 모든 사이트의 모든 클라이언트 요청에 대해 읽기-쓰기 일관성을 보장합니다. 메타데이터 복제본 쿼럼을 달성할 수 있는 경우 여러 노드 또는 사이트 장애에도 일관성을 제공합니다.
  - 이는 12.0 이상으로 새로 설치된 모든 시스템에 대한 기본 동작입니다.
  - QUORUM 일관성은 각 사이트에 3개의 메타데이터 복제본이 있는 스토리지 노드 메타데이터 복제본의 쿼럼으로 정의됩니다. 다음과 같이 계산할 수 있습니다. 1+((N*3)/2) 여기서 N은 총 사이트 수입니다.
  - 예를 들어, 3개 사이트 그리드에서 최소 5개의 복제본을 만들어야 하며, 사이트 내에는 최대 3개의 복제본이 있어야 합니다.
* 강력한 사이트 *: 사이트 내의 모든 클라이언트 요청에 대해 쓰기 후 읽기 일관성을 보장합니다.
* Read-after-new-write * (기본값): 새 개체에 대해 읽기-쓰기 후 일관성을 제공하고 개체 업데이트에 대한 최종 일관성을 제공합니다. 고가용성 및 데이터 보호 보장 제공 대부분의 경우에 권장됩니다.
* 사용 가능 *: 새 객체 및 객체 업데이트 모두에 대한 최종 일관성을 제공합니다. S3 버킷의 경우 필요한 경우에만 사용하십시오(예: 거의 읽지 않는 로그 값이 포함된 버킷의 경우 또는 존재하지 않는 키의 헤드 또는 GET 작업의 경우). S3 FabricPool 버킷은 지원되지 않습니다.

오브젝트 데이터 정합성

사이트 내부 및 사이트 간에 메타데이터가 자동으로 복제되지만, 오브젝트 데이터 스토리지를 배치할 결정은 사용자의 몫입니다. 오브젝트 데이터는 사이트 내부 및 사이트 간 복제본에 저장되거나, 사이트 내부 또는 사이트 간 삭제 코딩되거나, 복제 및 삭제 코딩 스토리지 스키마의 조합에 저장될 수 있습니다. ILM 규칙은 모든 오브젝트에 적용되거나 특정 오브젝트, 버킷 또는 테넌트에만 적용되도록 필터링될 수 있습니다. ILM 규칙은 객체의 저장 방식, 복제본 및/또는 삭제 코딩 방식, 해당 위치에 객체가 저장되는 기간, 복제본 또는 삭제 코딩 체계 수가 변경되거나 위치가 시간에 따라 변경될 경우 정의합니다.

각 ILM 규칙은 오브젝트 보호를 위한 세 가지 수집 동작 중 하나인 이중 커밋, 균등 또는 엄격 으로 구성됩니다.

듀얼 커밋 옵션은 그리드 내의 두 개의 서로 다른 스토리지 노드에 두 개의 사본을 즉시 만들고 클라이언트에게 요청이 성공했다는 것을 반환합니다. 노드 선택은 요청 사이트 내에서 시도되지만 어떤 상황에서는 다른 사이트의 노드를 사용할 수도 있습니다. 해당 객체는 ILM 대기열에 추가되어 ILM 규칙에 따라 평가되고 배치됩니다.

균형 잡힌 옵션은 ILM 정책에 대해 객체를 즉시 평가하고 클라이언트에게 요청을 성공적으로 반환하기 전에 객체를 동기적으로 배치합니다. 중단이나 배치 요구 사항을 충족할 만큼의 저장 공간이 부족하여 ILM 규칙을 즉시 충족할 수 없는 경우 대신 이중 커밋이 사용됩니다. 문제가 해결되면 ILM은 정의된 규칙에 따라 객체를 자동으로 배치합니다.

엄격한 옵션은 ILM 정책에 대해 객체를 즉시 평가하고 클라이언트에게 요청을 성공적으로 반환하기 전에 객체를 동기적으로 배치합니다. 중단이나 배치 요구 사항을 충족할 만큼의 저장 공간이 부족하여 ILM 규칙을 즉시 충족할 수 없는 경우 요청은 실패하고 클라이언트는 다시 시도해야 합니다.

로드 밸런싱

StorageGRID는 통합 게이트웨이 노드, 외부 타사 로드 밸런서, DNS 라운드 로빈 또는 스토리지 노드에 대한 직접 클라이언트 액세스를 통해 배포할 수 있습니다. 한 사이트에 여러 게이트웨이 노드를 구축하고 고가용성 그룹으로 구성하여 게이트웨이 노드가 중단될 경우 자동 페일오버 및 장애 복구를 제공할 수 있습니다. 솔루션에 로드 밸런싱 방법을 결합하여 솔루션의 모든 사이트에 대한 단일 액세스 지점을 제공할 수 있습니다.

게이트웨이 노드는 기본적으로 게이트웨이 노드가 있는 사이트의 스토리지 노드 간에 부하를 분산합니다. StorageGRID 구성하면 게이트웨이 노드가 여러 사이트의 노드를 사용하여 부하를 분산할 수 있습니다. 이 구성을 사용하면 클라이언트 요청에 대한 응답 지연에 해당 사이트 간의 지연이 추가됩니다. 이는 전체 지연 시간이 클라이언트에게 허용되는 경우에만 구성해야 합니다.

로컬 및 글로벌 부하 분산을 결합하면 RTO를 0으로 보장할 수 있습니다. 중단 없는 클라이언트 액세스를 보장하려면 클라이언트 요청의 부하 분산이 필요합니다. StorageGRID 솔루션은 각 사이트에 여러 개의 게이트웨이 노드와 고가용성 그룹을 포함할 수 있습니다. 사이트 장애 발생 시에도 모든 사이트의 클라이언트에 중단 없는 액세스를 제공하려면 StorageGRID Gateway 노드와 함께 외부 부하 분산 솔루션을 구성해야 합니다. 각 사이트 내의 부하를 관리하는 Gateway 노드 고가용성 그룹을 구성하고 외부 부하 분산 장치를 사용하여 고가용성 그룹 전체에서 부하를 분산합니다. 외부 로드 밸런서는 요청이 운영 사이트에만 전송되는지 확인하기 위해 상태 검사를 수행하도록 구성되어야 합니다. StorageGRID 사용한 부하 분산에 대한 자세한 내용은 다음을 참조하세요. "StorageGRID 로드 밸런서 기술 보고서".

StorageGRID 사용한 Zero RPO 요구 사항

오브젝트 스토리지 시스템에서 RPO(복구 시점 목표)를 0으로 달성하려면 장애 발생 시 다음 사항이 중요합니다.

메타데이터와 개체 콘텐츠 모두 동기화되며 정합성이 보장되는 것으로 간주됩니다
오류가 발생해도 개체 콘텐츠에 액세스할 수 있습니다.

다중 사이트 배포의 경우 Quorum Strong Global은 모든 사이트에서 메타데이터가 동기화되도록 보장하는 기본 일관성 모델로, 0 RPO 요구 사항을 충족하는 데 필수적입니다.

저장 시스템의 객체는 정보 수명 주기 관리(ILM) 규칙에 따라 저장됩니다. 이 규칙은 데이터가 수명 주기 전반에 걸쳐 어떻게, 어디에 저장되는지를 결정합니다. 동기 복제의 경우 엄격한 실행과 균형 실행을 고려할 수 있습니다.

이러한 ILM 규칙을 엄격하게 실행해야 제로 RPO에 대해 엄격한 실행이 필요합니다. 왜냐하면 지연 또는 폴백 없이 정의된 위치에 오브젝트를 배치하고 데이터 가용성과 일관성을 유지할 수 있기 때문입니다.
StorageGRID의 ILM 밸런스 수집 동작은 고가용성과 복구 성능 간의 균형을 유지하여 사이트 장애 시에도 사용자가 데이터를 계속 수집할 수 있도록 합니다.

여러 사이트에 동기 배포

다중 사이트 솔루션: StorageGRID 사용하면 그리드 내의 여러 사이트에 걸쳐 객체를 동기적으로 복제할 수 있습니다. 균형이나 엄격한 동작을 포함하는 정보 수명 주기 관리(ILM) 규칙을 설정하면 객체가 지정된 위치에 즉시 배치됩니다. 버킷 일관성 수준을 Quorum Strong Global로 구성하면 동기식 메타데이터 복제도 보장됩니다. StorageGRID 단일 글로벌 네임스페이스를 사용하여 객체 배치 위치를 메타데이터로 저장하므로 모든 노드가 모든 복사본이나 삭제 코드 조각의 위치를 알 수 있습니다. 요청이 이루어진 사이트에서 객체를 검색할 수 없는 경우 장애 조치 절차가 필요 없이 원격 사이트에서 자동으로 객체를 검색합니다.

장애가 해결되면 수동으로 페일백을 수행할 필요가 없습니다. 복제 성능은 네트워크 처리량이 가장 낮고 지연 시간이 가장 짧으며 성능이 가장 낮은 사이트에 따라 달라집니다. 사이트의 성능은 노드 수, CPU 코어 수 및 속도, 메모리, 드라이브 수 및 드라이브 유형에 따라 달라집니다.

다중 그리드 솔루션: * StorageGRID는 교차 그리드 복제(CGR)를 사용하여 여러 StorageGRID 시스템 간에 테넌트, 사용자 및 버킷을 복제할 수 있습니다. CGR은 선택한 데이터를 16개 이상의 사이트로 확장하고, 오브젝트 저장소의 사용 가능 용량을 늘리며, 재해 복구를 제공할 수 있습니다. CGR을 이용한 버킷 복제에는 객체, 객체 버전 및 메타데이터가 포함되며 양방향 또는 단방향 복제일 수 있습니다. RPO(복구 지점 목표)는 각 StorageGRID 시스템의 성능과 이러한 시스템 간의 네트워크 연결에 따라 달라집니다.
요약 : *
그리드 내 복제에는 동기식 및 비동기식 복제가 포함되며, ILM 수집 동작 및 메타데이터 정합성 제어를 사용하여 구성 가능합니다.
그리드 간 복제는 비동기식만 가능합니다.

단일 그리드 다중 사이트 배포

다음 시나리오에서 StorageGRID 솔루션은 통합 로드 밸런서 고가용성 그룹에 대한 요청을 관리하는 선택적 외부 로드 밸런서로 구성됩니다. 이를 통해 RPO가 0인 것 외에도 RTO도 0이 됩니다. ILM은 동기식 배치를 위한 균형 잡힌 수집 보호 기능으로 구성됩니다. 각 버킷은 3개 이상의 사이트 그리드의 경우 강력한 글로벌 일관성 모델의 Quorum 버전으로 구성되고, 2개 사이트의 경우 강력한 글로벌 일관성의 레거시 버전으로 구성됩니다.

시나리오 1:

2개 사이트 StorageGRID 솔루션에는 모든 객체의 복제본이 최소 2개 있고 모든 메타데이터의 복제본이 6개 있습니다. 장애 복구 시, 장애로 인한 업데이트는 복구된 사이트/노드에 자동으로 동기화됩니다. 사이트가 2개뿐이므로 전체 사이트가 손실되는 상황을 넘어 장애 발생 시 RPO를 0으로 유지하는 것은 불가능합니다.

2개 사이트 StorageGRID 시스템

시나리오 2:

3개 이상의 사이트로 구성된 StorageGRID 솔루션에는 모든 객체의 복제본 또는 EC 청크가 최소 3개 있고 모든 메타데이터의 복제본은 9개 있습니다. 장애 복구 시, 장애로 인한 업데이트는 복구된 사이트/노드에 자동으로 동기화됩니다. 사이트가 3개 이상인 경우 RPO를 0으로 설정하는 것이 가능합니다.

3개 사이트 StorageGRID 시스템

다중 사이트 장애 시나리오

실패	2개 사이트 결과 + 강력한 글로벌 레거시	3개 이상의 사이트 결과 + Quorum Strong Global
단일 노드 드라이브에 장애	각 어플라이언스는 여러 디스크 그룹을 사용하며 중단이나 데이터 손실 없이 그룹당 최소 1개의 드라이브를 유지할 수 있습니다.	각 어플라이언스는 여러 디스크 그룹을 사용하며 중단이나 데이터 손실 없이 그룹당 최소 1개의 드라이브를 유지할 수 있습니다.
단일 사이트에 단일 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.	운영 중단 또는 데이터 손실이 없습니다.
단일 사이트에 다중 노드 장애 발생	이 사이트로 리디렉션된 클라이언트 작업이 중단되지만 데이터는 손실되지 않습니다. 다른 사이트로 리디렉션된 작업은 중단 없이 지속되며 데이터 손실이 없습니다.	작업은 다른 모든 사이트로 전송되며 중단 없이 데이터 손실이 없습니다.
여러 사이트에서 단일 노드 장애 발생	다음과 같은 경우 중단 또는 데이터 손실 없음: 그리드에 최소 하나의 복제본이 존재합니다. 그리드에 충분한 EC 청크가 있습니다 작업이 중단되고 다음과 같은 경우 데이터 손실 위험이 있습니다. 복제본이 존재하지 않습니다 EC 척이 부족합니다	다음과 같은 경우 중단 또는 데이터 손실 없음: 그리드에 최소한 하나의 복제본이 존재합니다. 그리드에 충분한 EC 청크가 있습니다 작업이 중단되고 다음과 같은 경우 데이터 손실 위험이 있습니다. 복제본이 존재하지 않습니다 개체를 검색할 EC 척이 부족합니다
단일 사이트 장애	일부 클라이언트 작업은 장애가 해결될 때까지 중단됩니다. GET 및 HEAD 작업은 중단 없이 계속 진행됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요.	운영 중단 또는 데이터 손실이 없습니다.
단일 사이트 및 단일 노드 장애	일부 클라이언트 작업은 장애가 해결될 때까지 중단됩니다. HEAD 운영은 중단 없이 계속됩니다. 복제본이나 충분한 EC 청크가 있는 경우 GET 작업은 중단 없이 계속됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요.	운영이 중단되거나 데이터가 손실되지 않습니다. 복제본 수에 따라 데이터 손실이 발생할 수 있습니다. 로컬 삭제 코딩을 통해 데이터 손실을 방지할 수 있습니다.
단일 사이트 + 나머지 각 사이트의 노드 1개	두 개의 사이트만 존재합니다. 참조: 단일 사이트와 단일 노드.	메타데이터 복제본 쿼럼을 충족하지 못하면 작업이 중단됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 복제본 수에 따라 영구적인 실패로 인한 데이터 손실이 발생할 수 있습니다. 로컬 삭제 코딩을 통해 데이터 손실을 방지할 수 있습니다.
다중 사이트 장애	운영 중인 사이트는 더 이상 남아 있지 않습니다. 적어도 하나의 사이트를 전체적으로 복구할 수 없는 경우 데이터가 손실됩니다.	메타데이터 복제본 쿼럼을 충족하지 못하면 작업이 중단됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 충분한 삭제 코드 청크가 남아 있지 않으면 영구적인 오류로 인해 데이터가 손실될 가능성이 있습니다. 로컬 삭제 코딩이나 복제 사본을 사용하면 데이터 손실을 방지할 수 있습니다.
사이트의 네트워크 격리	오류가 해결될 때까지 클라이언트 작업이 중단됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 데이터 손실 없음	격리된 사이트의 운영은 중단되지만 데이터 손실은 발생하지 않습니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 나머지 사이트에서는 운영이 중단되지 않으며 데이터 손실도 없습니다.

실패

2개 사이트 결과 + 강력한 글로벌 레거시

3개 이상의 사이트 결과 + Quorum Strong Global

단일 노드 드라이브에 장애

각 어플라이언스는 여러 디스크 그룹을 사용하며 중단이나 데이터 손실 없이 그룹당 최소 1개의 드라이브를 유지할 수 있습니다.

단일 사이트에 단일 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

단일 사이트에 다중 노드 장애 발생

이 사이트로 리디렉션된 클라이언트 작업이 중단되지만 데이터는 손실되지 않습니다.

다른 사이트로 리디렉션된 작업은 중단 없이 지속되며 데이터 손실이 없습니다.

작업은 다른 모든 사이트로 전송되며 중단 없이 데이터 손실이 없습니다.

여러 사이트에서 단일 노드 장애 발생

다음과 같은 경우 중단 또는 데이터 손실 없음:

그리드에 최소 하나의 복제본이 존재합니다.
그리드에 충분한 EC 청크가 있습니다

작업이 중단되고 다음과 같은 경우 데이터 손실 위험이 있습니다.

복제본이 존재하지 않습니다
EC 척이 부족합니다

다음과 같은 경우 중단 또는 데이터 손실 없음:

그리드에 최소한 하나의 복제본이 존재합니다.
그리드에 충분한 EC 청크가 있습니다

작업이 중단되고 다음과 같은 경우 데이터 손실 위험이 있습니다.

복제본이 존재하지 않습니다
개체를 검색할 EC 척이 부족합니다

단일 사이트 장애

일부 클라이언트 작업은 장애가 해결될 때까지 중단됩니다. GET 및 HEAD 작업은 중단 없이 계속 진행됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요.

운영 중단 또는 데이터 손실이 없습니다.

단일 사이트 및 단일 노드 장애

일부 클라이언트 작업은 장애가 해결될 때까지 중단됩니다. HEAD 운영은 중단 없이 계속됩니다. 복제본이나 충분한 EC 청크가 있는 경우 GET 작업은 중단 없이 계속됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요.

운영이 중단되거나 데이터가 손실되지 않습니다. 복제본 수에 따라 데이터 손실이 발생할 수 있습니다. 로컬 삭제 코딩을 통해 데이터 손실을 방지할 수 있습니다.

단일 사이트 + 나머지 각 사이트의 노드 1개

두 개의 사이트만 존재합니다. 참조: 단일 사이트와 단일 노드.

메타데이터 복제본 쿼럼을 충족하지 못하면 작업이 중단됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 복제본 수에 따라 영구적인 실패로 인한 데이터 손실이 발생할 수 있습니다. 로컬 삭제 코딩을 통해 데이터 손실을 방지할 수 있습니다.

다중 사이트 장애

운영 중인 사이트는 더 이상 남아 있지 않습니다. 적어도 하나의 사이트를 전체적으로 복구할 수 없는 경우 데이터가 손실됩니다.

메타데이터 복제본 쿼럼을 충족하지 못하면 작업이 중단됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 충분한 삭제 코드 청크가 남아 있지 않으면 영구적인 오류로 인해 데이터가 손실될 가능성이 있습니다. 로컬 삭제 코딩이나 복제 사본을 사용하면 데이터 손실을 방지할 수 있습니다.

사이트의 네트워크 격리

오류가 해결될 때까지 클라이언트 작업이 중단됩니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 데이터 손실 없음

격리된 사이트의 운영은 중단되지만 데이터 손실은 발생하지 않습니다. 이 실패 상태에서도 중단 없이 작업을 계속하려면 버킷 일관성을 읽기-새로 쓰기로 줄이거나 낮추세요. 나머지 사이트에서는 운영이 중단되지 않으며 데이터 손실도 없습니다.

다중 사이트 다중 그리드 배포

중복성을 한층 더 강화하기 위해 이 시나리오에서는 두 개의 StorageGRID 클러스터를 사용하고 그리드 간 복제를 사용하여 동기화를 유지합니다. 이 솔루션의 경우 각 StorageGRID 클러스터에는 3개의 사이트가 있습니다. 두 사이트는 객체 스토리지와 메타데이터에 사용되고, 세 번째 사이트는 메타데이터에만 사용됩니다. 두 시스템 모두 두 데이터 사이트 각각에서 삭제 코딩을 사용하여 객체를 동기적으로 저장하기 위한 균형 잡힌 ILM 규칙으로 구성됩니다. 버킷은 Quorum Strong Global 일관성 모델로 구성됩니다. 각 그리드는 모든 버킷에서 양방향 크로스 그리드 복제를 구성합니다. 이는 지역 간 비동기 복제를 제공합니다. 선택적으로 글로벌 로드 밸런서를 구현하여 두 StorageGRID 시스템의 통합 로드 밸런서 고가용성 그룹에 대한 요청을 관리하여 RPO를 0으로 설정할 수 있습니다.

이 솔루션은 두 지역으로 균등하게 분할된 4개의 위치를 사용합니다. 영역 1은 그리드 1의 스토리지 사이트 2개를 영역의 기본 그리드로 포함하고 그리드 2의 메타데이터 사이트를 포함합니다. 영역 2는 그리드 2의 스토리지 사이트 2개를 영역의 기본 그리드로 포함하고 그리드 1의 메타데이터 사이트를 포함합니다. 각 영역에서 동일한 위치에 다른 영역 그리드의 메타데이터 전용 사이트와 해당 영역의 기본 그리드의 스토리지 사이트가 포함될 수 있습니다. 메타데이터만 세 번째 사이트로 사용하면 메타데이터에 필요한 일관성을 제공할 수 있고 해당 위치에 있는 객체의 저장소를 복제할 수 없습니다.

4개 사이트 멀티 그리드 솔루션

이 솔루션은 4개의 별도 위치를 통해 RPO를 0으로 유지하는 2개의 개별 StorageGRID 시스템을 완벽하게 이중화하고 멀티 사이트 동기식 복제와 멀티 그리드 비동기식 복제를 모두 활용합니다. 두 StorageGRID 시스템에서 아무런 중단 없는 클라이언트 작업을 유지하면서 단일 사이트에 장애가 발생할 수 있습니다.

이 솔루션에는 모든 오브젝트에 대해 삭제 코딩 4개의 복사본과 모든 메타데이터에 대한 복제본 18개가 있습니다. 따라서 클라이언트 작업에 영향을 주지 않고 여러 가지 장애 시나리오가 발생할 수 있습니다. 장애 발생 시 중단 시 복구 업데이트가 자동으로 장애가 발생한 사이트/노드에 동기화됩니다.

다중 사이트, 다중 그리드 장애 시나리오

실패	결과
단일 노드 드라이브에 장애	각 어플라이언스는 여러 디스크 그룹을 사용하며 중단이나 데이터 손실 없이 그룹당 최소 1개의 드라이브를 유지할 수 있습니다.
그리드에서 한 사이트에 단일 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
각 그리드에서 한 사이트에 단일 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
그리드에서 한 사이트에 다중 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
각 그리드에서 한 사이트에 여러 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
그리드의 여러 사이트에서 단일 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
각 그리드의 여러 사이트에서 단일 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.

그리드에서 단일 사이트 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
각 그리드에서 단일 사이트 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
그리드에서 단일 사이트와 단일 노드 장애 발생	운영 중단 또는 데이터 손실이 없습니다.
단일 사이트 + 나머지 각 사이트의 노드 1개가 단일 그리드에 포함됩니다	운영 중단 또는 데이터 손실이 없습니다.

단일 위치 장애	운영 중단 또는 데이터 손실이 없습니다.
각 그리드 DC1 및 DC3의 단일 위치 오류	장애가 해결되거나 버킷 일관성이 낮아질 때까지 작업이 중단됩니다. 각 그리드에서 2개의 사이트가 손실됩니다 모든 데이터는 여전히 2개 위치에 있습니다
각 그리드 DC1 및 DC4 또는 DC2 및 DC3의 단일 위치 오류	운영 중단 또는 데이터 손실이 없습니다.
각 그리드 DC2 및 DC4의 단일 위치 오류	운영 중단 또는 데이터 손실이 없습니다.

사이트의 네트워크 격리	격리된 사이트의 작업은 중단되지만 데이터는 손실되지 않습니다 나머지 사이트에서 작업을 중단하거나 데이터가 손실되지 않습니다.

실패

결과

단일 노드 드라이브에 장애

각 어플라이언스는 여러 디스크 그룹을 사용하며 중단이나 데이터 손실 없이 그룹당 최소 1개의 드라이브를 유지할 수 있습니다.

그리드에서 한 사이트에 단일 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

각 그리드에서 한 사이트에 단일 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

그리드에서 한 사이트에 다중 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

각 그리드에서 한 사이트에 여러 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

그리드의 여러 사이트에서 단일 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

각 그리드의 여러 사이트에서 단일 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

그리드에서 단일 사이트 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

각 그리드에서 단일 사이트 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

그리드에서 단일 사이트와 단일 노드 장애 발생

운영 중단 또는 데이터 손실이 없습니다.

단일 사이트 + 나머지 각 사이트의 노드 1개가 단일 그리드에 포함됩니다

운영 중단 또는 데이터 손실이 없습니다.

단일 위치 장애

운영 중단 또는 데이터 손실이 없습니다.

각 그리드 DC1 및 DC3의 단일 위치 오류

장애가 해결되거나 버킷 일관성이 낮아질 때까지 작업이 중단됩니다. 각 그리드에서 2개의 사이트가 손실됩니다

모든 데이터는 여전히 2개 위치에 있습니다

각 그리드 DC1 및 DC4 또는 DC2 및 DC3의 단일 위치 오류

운영 중단 또는 데이터 손실이 없습니다.

각 그리드 DC2 및 DC4의 단일 위치 오류

운영 중단 또는 데이터 손실이 없습니다.

사이트의 네트워크 격리

격리된 사이트의 작업은 중단되지만 데이터는 손실되지 않습니다

나머지 사이트에서 작업을 중단하거나 데이터가 손실되지 않습니다.

결론

StorageGRID로 복구 시점 목표(RPO)를 0으로 달성하는 것은 사이트 장애 발생 시 데이터 내구성과 가용성을 보장하는 데 있어 매우 중요한 목표입니다. 다중 사이트 동기식 복제 및 다중 그리드 비동기식 복제를 비롯한 StorageGRID의 강력한 복제 전략을 활용하여 조직은 클라이언트 작업을 중단 없이 유지하고 여러 위치에서 데이터 일관성을 유지할 수 있습니다. ILM(정보 수명 주기 관리) 정책을 구현하고 메타데이터 전용 노드를 사용하면 시스템의 복원력과 성능이 더욱 향상됩니다. StorageGRID을 사용하면 복잡한 장애 시나리오에서도 데이터에 액세스하고 일관되게 유지할 수 있으므로 데이터를 자신 있게 관리할 수 있습니다. 이러한 포괄적인 데이터 관리 및 복제 접근 방식은 제로 RPO를 달성하고 소중한 정보를 보호하는 데 있어 세심한 계획과 실행의 중요성을 강조합니다.

StorageGRID로 제로 RPO 달성 - 멀티 사이트 복제에 대한 포괄적인 가이드

Creating your file...

StorageGRID 개요

StorageGRID 확장

StorageGRID 및 장애 도메인

오브젝트 데이터 및 메타데이터

삭제 코딩

메타데이터 정합성

오브젝트 데이터 정합성

로드 밸런싱

StorageGRID 사용한 Zero RPO 요구 사항

여러 사이트에 동기 배포

단일 그리드 다중 사이트 배포

다중 사이트 다중 그리드 배포

결론