イレイジャーコーディングのメリット、デメリット、および要件
レプリケーションとイレイジャーコーディングのどちらを使用してオブジェクトデータを損失から保護するかを決定する前に、イレイジャーコーディングのメリット、デメリット、および要件を理解しておく必要があります。
イレイジャーコーディングのメリット
イレイジャーコーディングは、レプリケーションに比べて信頼性、可用性、ストレージ効率に優れています。
-
信頼性: データが失われることなく耐えられる同時障害の数によって測定されます。
-
レプリケーション: 複数の同一オブジェクトのコピーが異なるノードおよびサイト間に保存されます。
-
消失訂正符号化: オブジェクトはデータとパリティのフラグメントにエンコードされ、多数のノードとサイトに分散されます。この分散により、サイトとノードの両方の障害からの保護が提供されます。
-
-
可用性: ストレージ ノードに障害が発生したり、アクセスできなくなった場合にオブジェクトを取得する機能。レプリケーションと比較すると、消去コーディングでは同等のストレージ コストで可用性が向上します。
-
ストレージ効率: 同様の可用性と信頼性を実現するために、消去コード化されたオブジェクトは複製されたオブジェクトよりもディスク容量が少なくて済みます。たとえば、2 つのサイトに複製された 10 MB のオブジェクトは 20 MB のディスク領域 (2 つのコピー) を消費しますが、6+3 消失訂正符号化スキームを使用して 3 つのサイト間で消失訂正符号化されたオブジェクトは 15 MB のディスク領域しか消費しません。
イレイジャーコーディングオブジェクトのディスクスペースは、オブジェクトサイズにストレージオーバーヘッドを加えたものです。ストレージオーバーヘッドの割合は、パリティフラグメント数をデータフラグメント数で割って算出します。
イレイジャーコーディングのデメリット
レプリケーションと比較した場合のイレイジャーコーディングのデメリットは次のとおりです。
-
イレイジャーコーディングスキームに応じて、ストレージノードとサイトの数を増やすことを推奨します。一方、オブジェクトデータをレプリケートする場合、コピーごとに必要なストレージノードは1つだけです。およびを参照してください"3 つ以上のサイトを含むストレージプールのイレイジャーコーディングスキーム""1 サイトのストレージプールのイレイジャーコーディングスキーム"。
-
ストレージの拡張にかかるコストと複雑さが増大します。レプリケーションを使用する環境を拡張するには、オブジェクトコピーを作成するすべての場所にストレージ容量を追加します。イレイジャーコーディングを使用する環境を拡張する場合は、使用中のイレイジャーコーディングスキームと、既存のストレージノードの使用率の両方を考慮する必要があります。たとえば、既存のノードの使用率が100%になるまで待つ場合は、少なくともストレージノードを追加する必要があります `k+m`が、既存のノードの使用率が70%になって拡張する場合は、サイトごとにノードを2つ追加しても、使用可能なストレージ容量を最大化できます。詳細については、を参照してください "イレイジャーコーディングオブジェクトのストレージ容量を追加します"。
-
地理的に分散したサイトでイレイジャーコーディングを使用する場合は、読み出しのレイテンシが上昇します。イレイジャーコーディングされてリモートサイトに分散されたオブジェクトのオブジェクトフラグメントをWAN接続経由で読み出すには、レプリケートされてローカル(クライアントの接続先と同じサイト)で使用可能なオブジェクトよりも時間がかかります。
-
地理的に分散したサイトでイレイジャーコーディングを使用する場合は、特に WAN ネットワーク接続経由でオブジェクトを頻繁に読み出したり修復したりするケースでは読み出しと修復の WAN ネットワークトラフィックが増大します。
-
サイト間で消去コーディングを使用すると、サイト間のネットワーク遅延が増加するため、オブジェクトの最大スループットが大幅に低下します。この減少は TCP ネットワーク スループットの低下によって発生し、 StorageGRIDシステムがオブジェクト フラグメントを保存および取得する速度に影響します。
-
コンピューティングリソースの利用率が向上します。
イレイジャーコーディングを使用する状況
次の要件には消去コーディングを使用します。
-
1MB 超のオブジェクト
イレイジャーコーディングは 1MB を超えるオブジェクトに適しています。非常に小さいイレイジャーコーディングフラグメントを管理するオーバーヘッドを回避するために、200KB未満のオブジェクトにはイレイジャーコーディングを使用しないでください。 -
頻繁に読み出されないコンテンツの長期保存またはコールドストレージ。
-
高いデータ可用性と信頼性。
-
サイトやノードの障害に対する保護
-
Storage Efficiency:
-
複数のレプリケートコピーではなく 1 つのイレイジャーコーディングコピーのみを使用して効率的にデータを保護する必要のある単一サイト環境
-
サイト間レイテンシが 100 ミリ秒未満の複数サイト環境