日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

Confluent パフォーマンス検証

08/18/2025 共同作成者

PDF

NetApp ONTAP上の階層化ストレージについて、Confluent Platform を使用して検証を実施しました。 NetAppチームと Confluent チームは協力してこの検証に取り組み、必要なテストケースを実行しました。

合流セットアップ

セットアップには、3 つの動物園管理人、5 つのブローカー、および 256 GB の RAM と 16 個の CPU を備えた 5 つのテストサーバーを使用しました。 NetAppストレージには、 AFF A900 HA ペアを備えたONTAP を使用しました。ストレージとブローカーは 100GbE 接続を介して接続されました。

次の図は、階層型ストレージの検証に使用される構成のネットワークトポロジを示しています。

この図は、階層型ストレージの検証に使用される構成のネットワークトポロジを示しています。

ツールサーバーは、Confluent ノードとの間でイベントを送受信するアプリケーションクライアントとして機能します。

Confluent階層型ストレージ構成

次のテストパラメータを使用しました。

confluent.tier.fetcher.num.threads=80
confluent.tier.archiver.num.threads=80
confluent.tier.enable=true
confluent.tier.feature=true
confluent.tier.backend=S3
confluent.tier.s3.bucket=kafkabucket1-1
confluent.tier.s3.region=us-east-1
confluent.tier.s3.cred.file.path=/data/kafka/.ssh/credentials
confluent.tier.s3.aws.endpoint.override=http://wle-mendocino-07-08/
confluent.tier.s3.force.path.style.access=true
bootstrap.server=192.168.150.172:9092,192.168.150.120:9092,192.168.150.164:9092,192.168.150.198:9092,192.168.150.109:9092,192.168.150.165:9092,192.168.150.119:9092,192.168.150.133:9092
debug=true
jmx.port=7203
num.partitions=80
num.records=200000000
#object PUT size - 512MB and fetch 100MB – netapp
segment.bytes=536870912
max.partition.fetch.bytes=1048576000
#GET size is max.partition.fetch.bytes/num.partitions
length.key.value=2048
trogdor.agent.nodes=node0,node1,node2,node3,node4
trogdor.coordinator.hostname.port=192.168.150.155:8889
num.producers=20
num.head.consumers=20
num.tail.consumers=1
test.binary.task.max.heap.size=32G
test.binary.task.timeout.sec=3600
producer.timeout.sec=3600
consumer.timeout.sec=3600

検証には、HTTP プロトコルを使用したONTAPを使用しましたが、HTTPS も機能しました。アクセスキーと秘密鍵は、 `confluent.tier.s3.cred.file.path`パラメータ。

NetAppストレージコントローラ – ONTAP

検証のために、 ONTAPで単一の HA ペア構成を構成しました。

この図は、検証のために環境が単一の HA ペアとしてどのように構成されたかを示しています。

検証結果

検証のために以下の 5 つのテストケースを完了しました。最初の 2 つは機能テストであり、残りの 3 つはパフォーマンステストでした。

オブジェクトストアの正確性テスト

このテストでは、API 呼び出しを使用して、階層化ストレージに使用されるオブジェクトストアに対して get、put、delete などの基本操作を実行します。

階層化機能の正確性テスト

このテストでは、オブジェクトストレージのエンドツーエンドの機能をチェックします。トピックを作成し、新しく作成されたトピックへのイベントストリームを生成し、ブローカーがセグメントをオブジェクトストレージにアーカイブするのを待機し、イベントストリームを消費し、消費されたストリームが生成されたストリームと一致することを検証します。このテストは、オブジェクトストア障害注入ありとなしの状態で実行しました。 ONTAPのノードの 1 つでサービスマネージャサービスを停止し、エンドツーエンドの機能がオブジェクトストレージで動作することを検証することで、ノード障害をシミュレートしました。

階層フェッチベンチマーク

このテストでは、階層化オブジェクトストレージの読み取りパフォーマンスを検証し、ベンチマークによって生成されたセグメントからの高負荷状態での範囲フェッチ読み取り要求をチェックしました。このベンチマークでは、Confluent は階層フェッチ要求に対応するカスタムクライアントを開発しました。

生産・消費ワークロードジェネレータ

このテストは、セグメントのアーカイブを通じてオブジェクトストアへの書き込みワークロードを間接的に生成します。読み取りワークロード (読み取られたセグメント) は、コンシューマーグループがセグメントを取得したときにオブジェクトストレージから生成されました。このワークロードは TOCC スクリプトによって生成されました。このテストでは、並列スレッドでのオブジェクトストレージの読み取りと書き込みのパフォーマンスをチェックしました。階層化機能の正確性テストと同様に、オブジェクトストア障害注入の有無でテストを行いました。

保持ワークロードジェネレータ

このテストでは、トピック保持のワークロードが大きい場合のオブジェクトストレージの削除パフォーマンスをチェックしました。保持ワークロードは、テストトピックと並行して多数のメッセージを生成する TOCC スクリプトを使用して生成されました。テストトピックでは、サイズベースおよび時間ベースの積極的な保持設定が構成されていたため、イベントストリームがオブジェクトストアから継続的に消去されていました。その後、セグメントはアーカイブされました。これにより、ブローカーによるオブジェクトストレージ内の多数の削除と、オブジェクトストア削除操作のパフォーマンスの収集が行われました。

検証の詳細については、 "合流" Webサイト。