日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

『Achieving zero RPO with StorageGRID - A Comprehensive Guide to Multi-Site Replication』

04/03/2025 共同作成者

このテクニカルレポートでは、サイト障害が発生した場合に目標復旧時点（RPO）をゼロにするためのStorageGRIDレプリケーション戦略を実装するための包括的なガイドを提供します。このドキュメントでは、マルチサイトの同期レプリケーションやマルチグリッドの非同期レプリケーションなど、StorageGRIDのさまざまな導入オプションについて詳しく説明します。また、StorageGRIDの情報ライフサイクル管理（ILM）ポリシーを設定して、複数の場所にわたってデータの保持と可用性を確保する方法についても説明します。また、パフォーマンスに関する考慮事項、障害シナリオ、およびクライアント処理が中断されないように維持するためのリカバリプロセスについても説明します。このドキュメントの目的は、同期レプリケーションと非同期レプリケーションの両方の手法を活用して、サイト全体に障害が発生した場合でも、データへのアクセスと一貫性を維持するための情報を提供することです。

StorageGRIDの概要

NetApp StorageGRIDは、業界標準のAmazon Simple Storage Service（Amazon S3）APIをサポートするオブジェクトベースのストレージシステムです。

StorageGRIDは、情報ライフサイクル管理ポリシー（ILM）に基づくさまざまなサービスレベルで、複数の場所にわたって単一のネームスペースを提供します。このライフサイクルポリシーを使用することで、データのライフサイクルを通じてデータの配置場所を最適化できます。

StorageGRIDを使用すると、ローカルソリューションや地理的に分散したソリューションで、データの保持方法と可用性を設定できます。データがオンプレミスとパブリッククラウドのどちらにあっても、統合されたハイブリッドクラウドワークフローにより、Amazon Simple Notification Service（Amazon SNS）、Google Cloud、Microsoft Azure Blob、Amazon S3 Glacier、Elasticsearchなどのクラウドサービスを活用できます。

StorageGRIDスケール

StorageGRIDは、わずか3つのストレージノードで導入でき、1つのグリッドを最大200ノードまで拡張できます。単一のグリッドは、単一サイトとして導入することも、16サイトまで拡張することもできます。最小のグリッドは、1つのサイトに管理ノード1つとストレージノード3つで構成されます。管理ノードには管理インターフェイスがあり、指標とロギングを一元管理し、StorageGRIDコンポーネントの設定を維持します。管理ノードには、S3 APIアクセス用の統合されたロードバランサも含まれています。StorageGRIDは、ソフトウェアのみ、VMware仮想マシンアプライアンス、または専用アプライアンスとして導入できます。

StorageGRIDノードは、オブジェクト数を最大化するメタデータ専用ノード、オブジェクトスペースを最大化するオブジェクトストレージ専用ノード、またはメタデータとオブジェクトストレージを組み合わせてオブジェクト数とオブジェクトスペースの両方を追加するノードとして導入できます。各ストレージノードは、オブジェクトストレージ用に数ペタバイトの容量に拡張でき、数百ペタバイトの単一のネームスペースを使用できます。StorageGRIDには、ゲートウェイノードと呼ばれるS3 API処理用の統合ロードバランサも用意されています。

StorageGRIDの導入オプション

StorageGRIDは、サイトトポロジに配置された一連のノードで構成されます。StorageGRID内のサイトは、一意の物理的な場所にすることも、論理構成要素としてグリッド内の他のサイトと同じ物理的な場所に配置することもできます。StorageGRIDサイトは複数の物理的な場所にまたがることはできません。サイトは、共有ローカルエリアネットワーク（LAN）インフラストラクチャを表します。

StorageGRIDおよび障害ドメイン

StorageGRIDには障害ドメインの複数のレイヤが含まれており、ソリューションの設計方法、データの格納方法、障害のリスクを軽減するためのデータの格納場所を決定する際に考慮する必要があります。

グリッドレベル-複数のサイトで構成されるグリッドでは、サイト障害や分離が発生しても、アクセス可能なサイトはグリッドとして動作し続けることができます。
サイトレベル-サイト内で障害が発生した場合、そのサイトの運用に影響する可能性がありますが、グリッドの残りの部分には影響しません。
ノードレベル-ノード障害がサイトの運用に影響することはありません。
ディスクレベル-ディスク障害はノードの動作に影響しません。

オブジェクトデータとメタデータ

オブジェクトストレージでは、ストレージの単位がファイルやブロックではなく、オブジェクトになります。ファイルシステムやブロックストレージのツリー階層とは異なり、オブジェクトストレージでは、フラットで非構造化されたレイアウトでデータが編成されます。オブジェクトストレージでは、データの物理的な場所と、データを格納および読み出す方法が切り離されています。

オブジェクトベースのストレージシステムの各オブジェクトには、オブジェクトデータとオブジェクトメタデータという 2 つの要素があります。

オブジェクトデータは、写真、映画、医療記録など、実際の基礎データを表します。
オブジェクトメタデータは、オブジェクトについて記述された任意の情報です。

StorageGRID では、オブジェクトメタデータを使用してグリッド全体のすべてのオブジェクトの場所を追跡し、各オブジェクトのライフサイクルを継続的に管理します。

オブジェクトメタデータには、次のような情報が含まれます。

システムメタデータ（各オブジェクト（UUID）の一意のID、オブジェクト名、S3バケットの名前、テナントアカウントの名前またはID、オブジェクトの論理サイズ、オブジェクトの作成日時、オブジェクトの最終変更日時など）。
各オブジェクトレプリカまたはイレイジャーコーディングフラグメントの現在の格納場所。
オブジェクトに関連付けられているカスタムユーザメタデータのキーと値のペア。
S3オブジェクトの場合、オブジェクトに関連付けられているオブジェクトタグのキーと値のペア
セグメント化されたオブジェクトやマルチパートオブジェクトの場合、セグメント ID とデータサイズ。

オブジェクトメタデータはカスタマイズと拡張が可能なため、アプリケーションに合わせて柔軟に設定できます。StorageGRIDがオブジェクトメタデータを格納する方法と場所の詳細については、を参照してください "オブジェクトメタデータストレージを管理する"。

StorageGRIDの情報ライフサイクル管理（ILM）システムは、StorageGRIDシステム内のすべてのオブジェクトデータの配置、期間、取り込み動作のオーケストレーションに使用されます。ILMルールは、オブジェクトのレプリカを使用したり、ノードやサイト間でオブジェクトをイレイジャーコーディングしたりして、StorageGRIDが時間の経過に伴ってオブジェクトを格納する方法を決定します。このILMシステムは、グリッド内のオブジェクトデータの整合性を維持します。

イレイジャーコーディング

StorageGRIDは、複数のレベルでデータをイレイジャーコーディングする機能を提供します。StorageGRIDアプライアンスでは、すべてのドライブの各ノードに格納されているデータをRAIDを使用してイレイジャーコーディングし、複数のディスク障害によってデータの損失や中断が発生しないようにします。さらに、StorageGRIDでは、イレイジャーコーディングスキームを使用して、StorageGRIDのILMルールを使用して、サイト内のノード全体にオブジェクトデータを格納したり、StorageGRIDシステム内の3つ以上のサイトに分散して格納したりできます。

イレイジャーコーディングは、オーバーヘッドを抑えてノード障害に対する耐障害性を備えたストレージレイアウトを提供しますが、レプリケーションでもオーバーヘッドを増やして同様の処理を実行できます。データチャンクの格納に必要な最小限のノード数が満たされていれば、すべてのStorageGRIDイレイジャーコーディングスキームが1つのサイトに導入できます。つまり、4+2のECスキームでは、データを受信できるノードが少なくとも6つ必要です。

オブジェクトで使用可能なStorageGRIDイレイジャーコーディングスキーム

メタデータの整合性

StorageGRIDでは、整合性と可用性を確保するために、メタデータは通常、サイトごとに3つのレプリカとともに格納されます。この冗長性により、障害が発生した場合でも、データの整合性とアクセス性が維持されます。

デフォルトの整合性は、グリッド全体のレベルで定義されます。整合性はバケットレベルでいつでも変更できます。

StorageGRIDで使用できるバケット整合性オプションは次のとおりです。

all:最高レベルの一貫性を提供します。グリッド内のすべてのノードがすぐにデータを受信しないと、要求は失敗します。
* strong-global *：すべてのサイトのすべてのクライアント要求について、リードアフターライト整合性が保証されます。
* strong-global v2 *：すべてのサイトのすべてのクライアント要求に対してリードアフターライト整合性が保証されます。メタデータレプリカクォーラムが達成可能な場合は、複数のノードやサイト障害に対して整合性を提供します。たとえば、3サイトのグリッドから少なくとも5つのレプリカを作成し、1つのサイト内で最大3つのレプリカを作成する必要があります。
*strong-site *：サイト内のすべてのクライアント要求に対してリードアフターライト整合性が保証されます。
* Read-after-new-write *（デフォルト）：新規オブジェクトにはリードアフターライト整合性を提供し、オブジェクトの更新には結果整合性を提供します。高可用性が確保され、データ保護が保証されます。ほとんどの場合に推奨されます。
* available *：新しいオブジェクトとオブジェクトの更新の両方について、結果整合性を提供します。S3バケットの場合は、必要な場合にのみ使用します（読み取り頻度の低いログ値を含むバケットや、存在しないキーに対するHEAD処理やGET処理など）。S3 FabricPool バケットではサポートされません。

オブジェクトデータの整合性

メタデータはサイト内およびサイト間で自動的にレプリケートされますが、オブジェクトデータのストレージ配置はユーザが決定します。オブジェクトデータは、サイト内およびサイト間のレプリカ、サイト内またはサイト間のイレイジャーコーディング、またはそれらの組み合わせまたはレプリカとイレイジャーコーディングされたストレージスキームに格納できます。ILMルールは、すべてのオブジェクトに適用することも、特定のオブジェクト、バケット、テナントにのみ適用するようにフィルタリングすることもできます。ILMルールは、オブジェクトの格納方法、レプリカやイレイジャーコーディング、それらの場所にオブジェクトを格納する期間、レプリカの数やイレイジャーコーディングスキームの変更、場所の変更などを定義します。

各ILMルールでは、オブジェクトを保護するための3つの取り込み動作（Dual commit、balanced、またはstrict）のいずれかを設定します。

デュアルコミットオプションは、グリッド内の任意の2つの異なるストレージノードにただちに2つのコピーを作成し、要求が成功したことをクライアントに返します。ノード選択は要求のサイト内で試行されますが、状況によっては別のサイトのノードを使用する場合があります。オブジェクトがILMキューに追加され、ILMルールに従って評価および配置されます。

balancedオプションは、ILMポリシーに照らしてオブジェクトをただちに評価し、クライアントに要求が成功する前にオブジェクトを同期的に配置します。停止や配置要件を満たすのに十分なストレージがないためにILMルールをすぐに満たすことができない場合は、代わりにデュアルコミットが使用されます。問題が解決すると、定義されたルールに基づいてオブジェクトが自動的に配置されます。

strictオプションを指定すると、ILMポリシーに照らしてオブジェクトがただちに評価され、オブジェクトが同期的に配置されてからクライアントに要求が成功します。停止や配置要件を満たすのに十分なストレージがないためにILMルールをすぐに満たすことができない場合は、要求が失敗し、クライアントは再試行する必要があります。

ロードバランシング

StorageGRIDは、統合ゲートウェイノード、外部の3^rdパーティロードバランサ、DNSラウンドロビンを介してクライアントアクセスを使用して導入することも、ストレージノードに直接導入することもできます。1つのサイトに複数のゲートウェイノードを導入し、ハイアベイラビリティグループに構成して、ゲートウェイノードに障害が発生した場合の自動フェイルオーバーとフェイルバックを実現できます。ソリューション内のロードバランシング方式を組み合わせて、ソリューション内のすべてのサイトに単一のアクセスポイントを提供できます。

デフォルトでは、ゲートウェイノードが配置されているサイトのストレージノード間で負荷が分散されます。StorageGRIDは、複数のサイトのノードを使用してゲートウェイノードが負荷を分散できるように設定できます。この構成では、これらのサイト間のレイテンシがクライアント要求への応答レイテンシに追加されます。これは、合計レイテンシがクライアントで許容可能な場合にのみ設定してください。

StorageGRIDでRPOをゼロにする方法

オブジェクトストレージシステムで目標復旧時点（RPO）をゼロにするには、障害発生時に次のことを行うことが重要です。

メタデータとオブジェクトコンテンツの両方が同期され、整合性があるとみなされる
障害が発生しても、オブジェクトコンテンツには引き続きアクセスできます。

マルチサイト環境では、メタデータがすべてのサイト間で同期されるようにするための整合性モデルとして、強力なGlobal V2が推奨されます。これにより、RPOゼロの要件を満たすことが不可欠になります。

ストレージシステム内のオブジェクトは、情報ライフサイクル管理（ILM）ルールに基づいて格納されます。ILMルールは、ライフサイクル全体を通じてデータをどこにどのように格納するかを規定します。同期レプリケーションの場合は、Strict実行とBalanced Executionのどちらを使用するかを検討できます。

RPOをゼロにするには、これらのILMルールを厳密に実行する必要があります。これは、オブジェクトが定義された場所に配置される際に遅延やフォールバックが発生することなく、データの可用性と整合性が維持されるためです。
StorageGRIDのILM Balanceの取り込み動作は、高可用性と耐障害性のバランスを実現し、サイト障害が発生した場合でもデータの取り込みを継続できるようにします。

必要に応じて、ローカルとグローバルのロードバランシングを組み合わせてRTOをゼロにすることもできます。クライアントアクセスが中断されないようにするには、クライアント要求のロードバランシングが必要です。StorageGRIDソリューションには、各サイトに多数のゲートウェイノードとハイアベイラビリティグループを含めることができます。サイト障害が発生した場合でも、いずれかのサイトのクライアントに中断なくアクセスできるようにするには、外部のロードバランシングソリューションをStorageGRIDゲートウェイノードと組み合わせて設定する必要があります。各サイト内の負荷を管理するゲートウェイノードのハイアベイラビリティグループを設定し、外部のロードバランサを使用してハイアベイラビリティグループ間で負荷を分散します。要求が運用サイトにのみ送信されるように、健全性チェックを実行するように外部のロードバランサを設定する必要があります。StorageGRIDを使用したロードバランシングの詳細については、を参照してください "StorageGRIDロードバランサのテクニカルレポート"。

複数サイト間での同期導入

マルチサイトソリューション： StorageGRIDを使用すると、グリッド内の複数のサイト間でオブジェクトを同期的にレプリケートできます。BalanceまたはStrictの動作でInformation Lifecycle Management（ILM；情報ライフサイクル管理）ルールを設定することで、オブジェクトは指定した場所にただちに配置されます。バケットの整合性レベルをstrongGlobal v2に設定すると、メタデータの同期レプリケーションも確実に実行されます。StorageGRIDは単一のグローバルネームスペースを使用してオブジェクトの配置場所をメタデータとして格納するため、すべてのノードがすべてのコピーまたはイレイジャーコーディングされたピースの配置場所を認識します。要求が行われたサイトからオブジェクトを読み出すことができない場合は、フェイルオーバーの手順を必要とせずにリモートサイトからオブジェクトが自動的に読み出されます。

障害が解決されると、手動のフェイルバック作業は必要ありません。レプリケーションパフォーマンスは、ネットワークスループット、レイテンシ、パフォーマンスが最も低いサイトによって異なります。サイトのパフォーマンスは、ノード数、CPUコア数と速度、メモリ、ドライブ数、ドライブタイプに基づいて決まります。

マルチグリッドソリューション： StorageGRIDでは、クロスグリッドレプリケーション（CGR）を使用して、複数のStorageGRIDシステム間でテナント、ユーザ、バケットをレプリケートできます。CGRを使用すると、選択したデータを16以上のサイトに拡張し、オブジェクトストアの使用可能な容量を増やし、ディザスタリカバリを実現できます。CGRを使用したバケットのレプリケーションには、オブジェクト、オブジェクトバージョン、メタデータが含まれ、双方向でも一方向でもかまいません。Recovery Point Objective（RPO；目標復旧時点）は、各StorageGRIDシステムのパフォーマンスと、それらのシステム間のネットワーク接続によって異なります。

概要：

グリッド内レプリケーションには同期レプリケーションと非同期レプリケーションの両方が含まれており、ILMの取り込み動作とメタデータの整合性制御を使用して設定できます。
グリッド間レプリケーションは非同期のみです。

単一グリッドのマルチサイト環境

次のシナリオでは、StorageGRIDソリューションに、統合されたロードバランサハイアベイラビリティグループへの要求を管理するオプションの外部ロードバランサを設定します。これにより、RPOゼロに加えてRTOもゼロになります。ILMには、同期配置用のBalanced取り込み保護が設定されています。各バケットには、3つ以上のサイトのグリッドでは強力なグローバルv2整合性モデルが設定され、3つ未満のサイトでは強力なグローバル整合性モデルが設定されます。

2サイトのStorageGRIDソリューションには、すべてのオブジェクトのレプリカが少なくとも2つ、つまりECチャンクが3つ、すべてのメタデータのレプリカが6つあります。障害からのリカバリ時には、停止からの更新がリカバリされたサイト/ノードに自動的に同期されます。サイトが2つしかない場合、サイト全体が失われても、障害シナリオでゼロRPOを達成することはほとんどありません。

2サイトのStorageGRIDシステム

3つ以上のサイトで構成されるStorageGRIDソリューションでは、各オブジェクトのレプリカが少なくとも3つまたはECチャンクが3つ、すべてのメタデータのレプリカが9つ存在します。障害からのリカバリ時には、停止からの更新がリカバリされたサイト/ノードに自動的に同期されます。サイトが3つ以上の場合は、RPOゼロを達成できます。

3サイトのStorageGRIDシステム

複数サイトの障害のシナリオ

障害	2サイトの成果	3サイト以上の成果
単一ノードドライブ障害	各アプライアンスは複数のディスクグループを使用し、中断やデータ損失を発生させることなく、グループごとに少なくとも1本のドライブに障害が発生しても運用を継続できます。	各アプライアンスは複数のディスクグループを使用し、中断やデータ損失を発生させることなく、グループごとに少なくとも1本のドライブに障害が発生しても運用を継続できます。
1つのサイトでの単一ノード障害	運用の中断やデータ損失は発生しません。	運用の中断やデータ損失は発生しません。
1つのサイトでの複数ノードの障害	このサイトに転送されるクライアント処理が中断されますが、データ損失はありません。もう一方のサイトに転送される処理は中断されず、データ損失も発生しません。	処理は他のすべてのサイトに転送され、中断されず、データ損失も発生しません。
複数サイトでの単一ノード障害	次の場合、システムの停止やデータ損失はゼログリッドに少なくとも1つのレプリカが存在するグリッドに十分な数のECチャンクが存在する次の場合には、運用が停止し、データ損失のリスクが発生します。レプリカが存在しません ECチャックが不十分	次の場合、システムの停止やデータ損失はゼログリッドに少なくとも1つのレプリカが存在するグリッドに十分な数のECチャンクが存在する次の場合には、運用が停止し、データ損失のリスクが発生します。レプリカが存在しませんオブジェクトを読み出すための十分なECチャックが存在しません
単一サイト障害	クライアント処理は、障害が解決されるか、バケットの整合性が強力なサイト以下になるまで中断され、処理は成功しますがデータ損失はありません。	運用の中断やデータ損失は発生しません。
単一サイトと単一ノードの障害	クライアント処理は、障害が解決されるか、バケット整合性がread-after-new-write以下に低下して処理が成功してデータが失われる可能性があるまで中断されます。	運用の中断やデータ損失は発生しません。
1つのサイトと残りの各サイトの1つのノード	クライアント処理は、障害が解決されるか、バケット整合性がread-after-new-write以下に低下して処理が成功してデータが失われる可能性があるまで中断されます。	メタデータレプリカのクォーラムを達成できず、データが失われる可能性がある場合は、処理が中断されます。
複数サイト障害	少なくとも1つのサイト全体をリカバリできない場合、データが失われます。	メタデータレプリカクォーラムを達成できないと、処理が中断されます。少なくとも1つのサイトが残っていれば、データ損失は発生しません。
サイトのネットワーク分離	クライアント処理は、障害が解決されるか、バケットの整合性が強力なサイト以下に低下して処理が成功するまで中断されますが、データの損失は発生しません。	分離されたサイトの処理は中断されるが、データ損失は発生しない残りのサイトでは処理が中断されず、データ損失も発生しません。

障害

2サイトの成果

3サイト以上の成果

単一ノードドライブ障害

各アプライアンスは複数のディスクグループを使用し、中断やデータ損失を発生させることなく、グループごとに少なくとも1本のドライブに障害が発生しても運用を継続できます。

1つのサイトでの単一ノード障害

運用の中断やデータ損失は発生しません。

1つのサイトでの複数ノードの障害

このサイトに転送されるクライアント処理が中断されますが、データ損失はありません。

もう一方のサイトに転送される処理は中断されず、データ損失も発生しません。

処理は他のすべてのサイトに転送され、中断されず、データ損失も発生しません。

複数サイトでの単一ノード障害

次の場合、システムの停止やデータ損失はゼロ

グリッドに少なくとも1つのレプリカが存在する
グリッドに十分な数のECチャンクが存在する

次の場合には、運用が停止し、データ損失のリスクが発生します。

レプリカが存在しません
ECチャックが不十分

次の場合、システムの停止やデータ損失はゼロ

グリッドに少なくとも1つのレプリカが存在する
グリッドに十分な数のECチャンクが存在する

次の場合には、運用が停止し、データ損失のリスクが発生します。

レプリカが存在しません
オブジェクトを読み出すための十分なECチャックが存在しません

単一サイト障害

クライアント処理は、障害が解決されるか、バケットの整合性が強力なサイト以下になるまで中断され、処理は成功しますがデータ損失はありません。

運用の中断やデータ損失は発生しません。

単一サイトと単一ノードの障害

クライアント処理は、障害が解決されるか、バケット整合性がread-after-new-write以下に低下して処理が成功してデータが失われる可能性があるまで中断されます。

運用の中断やデータ損失は発生しません。

1つのサイトと残りの各サイトの1つのノード

メタデータレプリカのクォーラムを達成できず、データが失われる可能性がある場合は、処理が中断されます。

複数サイト障害

少なくとも1つのサイト全体をリカバリできない場合、データが失われます。

メタデータレプリカクォーラムを達成できないと、処理が中断されます。少なくとも1つのサイトが残っていれば、データ損失は発生しません。

サイトのネットワーク分離

クライアント処理は、障害が解決されるか、バケットの整合性が強力なサイト以下に低下して処理が成功するまで中断されますが、データの損失は発生しません。

分離されたサイトの処理は中断されるが、データ損失は発生しない

残りのサイトでは処理が中断されず、データ損失も発生しません。

マルチサイトマルチグリッド環境

冗長性をさらに高めるために、このシナリオでは2つのStorageGRIDクラスタを使用し、グリッド間レプリケーションを使用して同期を維持します。このソリューションでは、各StorageGRIDクラスタに3つのサイトがあります。2つのサイトがオブジェクトストレージとメタデータに使用され、3つ目のサイトはメタデータ専用に使用されます。どちらのシステムにも、イレイジャーコーディングを使用してオブジェクトを同期的に格納するBalanced ILMルールが設定されます。バケットには、強力なグローバルv2整合性モデルが設定されます。各グリッドでは、すべてのバケットで双方向のグリッド間レプリケーションが設定されます。これにより、リージョン間の非同期レプリケーションが提供されます。必要に応じて、グローバルロードバランサを実装して両方のStorageGRIDシステムの統合されたロードバランサハイアベイラビリティグループへの要求を管理し、RPOをゼロにすることができます。

このソリューションでは、2つのリージョンに均等に分割された4つのロケーションを使用します。リージョン1には、リージョンのプライマリグリッドであるグリッド1の2つのストレージサイトと、グリッド2のメタデータサイトが含まれます。リージョン2には、リージョンのプライマリグリッドであるグリッド2の2つのストレージサイトと、グリッド1のメタデータサイトが含まれます。各リージョンでは、同じ場所にそのリージョンのプライマリグリッドのストレージサイトと、他のリージョンのメタデータ専用サイトを格納できます。メタデータのみのノードを3番目のサイトとして使用すると、メタデータに必要な整合性が確保され、その場所にあるオブジェクトのストレージが複製されることはありません。

4サイトのマルチグリッドソリューション

このソリューションには4つの場所があり、2つのStorageGRIDシステムの完全な冗長性が確保されます。RPOは0に維持され、マルチサイトの同期レプリケーションとマルチグリッドの非同期レプリケーションの両方が利用されます。いずれかのサイトで障害が発生しても、両方のStorageGRIDシステムでクライアント処理が中断されることはありません。

このソリューションでは、各オブジェクトのイレイジャーコーディングコピーが4つ、すべてのメタデータのレプリカが18個あります。これにより、クライアント処理に影響を与えることなく、複数の障害シナリオに対応できます。障害が発生すると、障害からのリカバリの更新が障害が発生したサイト/ノードに自動的に同期されます。

マルチサイト、マルチグリッドの障害シナリオ

障害	成果
単一ノードドライブ障害	各アプライアンスは複数のディスクグループを使用し、中断やデータ損失を発生させることなく、グループごとに少なくとも1本のドライブに障害が発生しても運用を継続できます。
グリッド内の一方のサイトでの単一ノード障害	運用の中断やデータ損失は発生しません。
各グリッドの1つのサイトでの単一ノード障害	運用の中断やデータ損失は発生しません。
グリッド内の1つのサイトでの複数ノードの障害	運用の中断やデータ損失は発生しません。
各グリッドの1つのサイトでの複数ノードの障害	運用の中断やデータ損失は発生しません。
グリッド内の複数のサイトにおける単一ノード障害	運用の中断やデータ損失は発生しません。
各グリッドの複数サイトでの単一ノード障害	運用の中断やデータ損失は発生しません。

グリッド内の単一サイト障害	運用の中断やデータ損失は発生しません。
各グリッドにおける単一サイト障害	運用の中断やデータ損失は発生しません。
グリッド内の単一サイトと単一ノードの障害	運用の中断やデータ損失は発生しません。
単一のグリッド内の単一のサイトと各サイトのノード	運用の中断やデータ損失は発生しません。

単一ロケーション障害	運用の中断やデータ損失は発生しません。
各グリッドDC1およびDC3での単一ロケーション障害	障害が解決されるかバケットの整合性が低下するまで処理が中断され、各グリッドで2つのサイトが失われるすべてのデータが2箇所に存在
各グリッドDC1およびDC4またはDC2およびDC3での単一ロケーション障害	運用の中断やデータ損失は発生しません。
各グリッドDC2およびDC4での単一ロケーション障害	運用の中断やデータ損失は発生しません。

サイトのネットワーク分離	分離されたサイトの処理は中断されるが、データは失われない残りのサイトの処理が中断されたり、データが失われたりすることはありません。

障害

成果

単一ノードドライブ障害

グリッド内の一方のサイトでの単一ノード障害

運用の中断やデータ損失は発生しません。

各グリッドの1つのサイトでの単一ノード障害

運用の中断やデータ損失は発生しません。

グリッド内の1つのサイトでの複数ノードの障害

運用の中断やデータ損失は発生しません。

各グリッドの1つのサイトでの複数ノードの障害

運用の中断やデータ損失は発生しません。

グリッド内の複数のサイトにおける単一ノード障害

運用の中断やデータ損失は発生しません。

各グリッドの複数サイトでの単一ノード障害

運用の中断やデータ損失は発生しません。

グリッド内の単一サイト障害

運用の中断やデータ損失は発生しません。

各グリッドにおける単一サイト障害

運用の中断やデータ損失は発生しません。

グリッド内の単一サイトと単一ノードの障害

運用の中断やデータ損失は発生しません。

単一のグリッド内の単一のサイトと各サイトのノード

運用の中断やデータ損失は発生しません。

単一ロケーション障害

運用の中断やデータ損失は発生しません。

各グリッドDC1およびDC3での単一ロケーション障害

障害が解決されるかバケットの整合性が低下するまで処理が中断され、各グリッドで2つのサイトが失われる

すべてのデータが2箇所に存在

各グリッドDC1およびDC4またはDC2およびDC3での単一ロケーション障害

運用の中断やデータ損失は発生しません。

各グリッドDC2およびDC4での単一ロケーション障害

運用の中断やデータ損失は発生しません。

サイトのネットワーク分離

分離されたサイトの処理は中断されるが、データは失われない

残りのサイトの処理が中断されたり、データが失われたりすることはありません。

まとめ

StorageGRIDでゼロ目標復旧時点（RPO）を達成することは、サイト障害が発生した場合にデータの保持と可用性を確保するための重要な目標です。マルチサイト同期レプリケーションやマルチグリッド非同期レプリケーションなど、StorageGRIDの堅牢なレプリケーション戦略を活用することで、中断のないクライアント処理を維持し、複数の場所でデータの整合性を確保できます。情報ライフサイクル管理（ILM）ポリシーの実装とメタデータのみのノードの使用により、システムの耐障害性とパフォーマンスがさらに強化されます。StorageGRIDを使用すると、複雑な障害シナリオが発生した場合でも、データへのアクセス性と一貫性を維持しながら、企業は自信を持ってデータを管理できます。データ管理とレプリケーションに対するこの包括的なアプローチは、RPOゼロを達成し、貴重な情報を保護するための綿密な計画と実行の重要性を強調しています。

『Achieving zero RPO with StorageGRID - A Comprehensive Guide to Multi-Site Replication』

Creating your file...

StorageGRIDの概要

StorageGRIDスケール

StorageGRIDおよび障害ドメイン

オブジェクトデータとメタデータ

イレイジャーコーディング

メタデータの整合性

オブジェクトデータの整合性

ロードバランシング

StorageGRIDでRPOをゼロにする方法

複数サイト間での同期導入

単一グリッドのマルチサイト環境

マルチサイトマルチグリッド環境

まとめ