日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

ベクターデータベースのパフォーマンス検証

08/18/2025 共同作成者

PDF

このセクションでは、ベクターデータベースで実行されたパフォーマンス検証について説明します。

パフォーマンス検証

パフォーマンス検証は、ベクターデータベースとストレージシステムの両方で重要な役割を果たし、最適な操作と効率的なリソース利用を保証するための重要な要素となります。高次元データの処理や類似性検索の実行で知られるベクターデータベースでは、複雑なクエリを迅速かつ正確に処理するために、高いパフォーマンスレベルを維持する必要があります。パフォーマンス検証は、ボトルネックを特定し、構成を微調整し、サービスの低下なしにシステムが予想される負荷を処理できることを保証するのに役立ちます。同様に、ストレージシステムでは、全体的なシステムパフォーマンスに影響を与える可能性のある遅延の問題やボトルネックが発生することなく、データが効率的に保存および取得されるようにするために、パフォーマンス検証が不可欠です。また、ストレージインフラストラクチャの必要なアップグレードや変更について、情報に基づいた意思決定を行うのにも役立ちます。したがって、パフォーマンス検証はシステム管理の重要な側面であり、高いサービス品質、運用効率、およびシステム全体の信頼性の維持に大きく貢献します。

このセクションでは、Milvus や pgvecto.rs などのベクトルデータベースのパフォーマンス検証を詳しく検討し、LLM ライフサイクル内での RAG および推論ワークロードをサポートする I/O プロファイルやネットアップストレージコントローラの動作などのストレージパフォーマンス特性に焦点を当てます。これらのデータベースをONTAPストレージソリューションと組み合わせた場合のパフォーマンスの差別化要因を評価し、特定します。私たちの分析は、1 秒あたりに処理されるクエリ数 (QPS) などの主要なパフォーマンス指標に基づいて行われます。

milvus と進捗状況に使用された方法論については以下を確認してください。

詳細

Milvus (スタンドアロンおよびクラスター)

Postgres(pgvecto.rs) #

version

2.3.2

0.2.0

Filesystem

iSCSI LUN 上の XFS

ワークロードジェネレーター

"VectorDBベンチ"– v0.0.5

データセット

LAIONデータセット * 1000万個の埋め込み * 768次元 * 約300GBのデータセットサイズ

ストレージコントローラ

AFF 800 * バージョン – 9.14.1 * 4 x 100GbE – milvus用、2x 100GbE（postgres用） * iscsi

Milvus スタンドアロンクラスターを使用した VectorDB-Bench

VectorDB-Bench を使用して、milvus スタンドアロンクラスターで次のパフォーマンス検証を実行しました。 milvus スタンドアロンクラスターのネットワークとサーバー接続は次のとおりです。

入出力ダイアログまたは書かれたコンテンツを示す図

このセクションでは、Milvus スタンドアロンデータベースのテストから得た観察結果を共有します。。これらのテストのインデックスタイプとして DiskANN を選択しました。。約 100 GB のデータセットの取り込み、最適化、インデックス作成には約 5 時間かかりました。この期間の大半では、20 個のコア (ハイパースレッディングを有効にすると 40 個の vCPU に相当) を搭載した Milvus サーバーが最大 CPU 容量の 100% で動作していました。DiskANN は、システムメモリサイズを超える大規模なデータセットで特に重要であることがわかりました。。クエリフェーズでは、1 秒あたりのクエリ数 (QPS) レートが 10.93、リコールが 0.9987 でした。クエリの 99 パーセンタイルレイテンシは 708.2 ミリ秒と測定されました。

ストレージの観点から見ると、データベースは、取り込み、挿入後の最適化、およびインデックス作成の各フェーズで約 1,000 オペレーション/秒を発行しました。クエリフェーズでは、32,000 オペレーション/秒が要求されました。

次のセクションでは、ストレージパフォーマンスメトリックを示します。

ワークロードフェーズ	指標	Value
データの取り込みと挿入後の最適化	IOPS	1,000未満
	レイテンシー	400 マイクロ秒未満
	ワークロード	読み取り/書き込みの混合、主に書き込み
	IOサイズ	64 KB
クエリ	IOPS	ピーク時32,000
	レイテンシー	400 マイクロ秒未満
	ワークロード	100%キャッシュ読み取り
	IOサイズ	主に8KB

ワークロードフェーズ

指標

Value

データの取り込みと挿入後の最適化

IOPS

1,000未満

レイテンシー

400 マイクロ秒未満

ワークロード

読み取り/書き込みの混合、主に書き込み

IOサイズ

64 KB

クエリ

IOPS

ピーク時32,000

レイテンシー

400 マイクロ秒未満

ワークロード

100%キャッシュ読み取り

IOサイズ

主に8KB

VectorDB-benchの結果は以下の通りです。

入出力ダイアログまたは書かれたコンテンツを示す図

スタンドアロン Milvus インスタンスのパフォーマンス検証から、現在の設定では次元数が 1536 の 500 万ベクトルのデータセットをサポートするには不十分であることが明らかです。ストレージには十分なリソースがあり、システムのボトルネックにはならないと判断しました。

milvus クラスターを使用した VectorDB-Bench

このセクションでは、Kubernetes 環境内での Milvus クラスターの展開について説明します。この Kubernetes セットアップは、Kubernetes マスターノードとワーカーノードをホストする VMware vSphere デプロイメント上に構築されました。

VMware vSphere および Kubernetes のデプロイメントの詳細については、次のセクションで説明します。

入出力ダイアログまたは書かれたコンテンツを示す図

このセクションでは、Milvus データベースのテストから得られた観察結果を紹介します。 * 使用されたインデックスタイプは DiskANN です。 * 以下の表は、1536 次元で 500 万のベクトルを扱う場合のスタンドアロン展開とクラスター展開の比較を示しています。クラスター展開では、データの取り込みと挿入後の最適化にかかる時間が短くなることがわかりました。スタンドアロン設定と比較して、クラスター展開ではクエリの 99 パーセンタイルレイテンシが 6 分の 1 に削減されました。 * クラスター展開では 1 秒あたりのクエリ数 (QPS) レートは高くなりましたが、望ましいレベルには達しませんでした。

入出力ダイアログまたは書かれたコンテンツを示す図

以下の画像は、ストレージクラスターのレイテンシや合計 IOPS (1 秒あたりの入出力操作数) など、さまざまなストレージメトリックを示しています。

入出力ダイアログまたは書かれたコンテンツを示す図

次のセクションでは、主要なストレージパフォーマンスメトリックを示します。

ワークロードフェーズ	指標	Value
データの取り込みと挿入後の最適化	IOPS	1,000未満
	レイテンシー	400 マイクロ秒未満
	ワークロード	読み取り/書き込みの混合、主に書き込み
	IOサイズ	64 KB
クエリ	IOPS	ピーク時14万7000人
	レイテンシー	400 マイクロ秒未満
	ワークロード	100%キャッシュ読み取り
	IOサイズ	主に8KB

ワークロードフェーズ

指標

Value

データの取り込みと挿入後の最適化

IOPS

1,000未満

レイテンシー

400 マイクロ秒未満

ワークロード

読み取り/書き込みの混合、主に書き込み

IOサイズ

64 KB

クエリ

IOPS

ピーク時14万7000人

レイテンシー

400 マイクロ秒未満

ワークロード

100%キャッシュ読み取り

IOサイズ

主に8KB

スタンドアロン Milvus と Milvus クラスターの両方のパフォーマンス検証に基づいて、ストレージ I/O プロファイルの詳細を示します。 * I/O プロファイルは、スタンドアロン展開とクラスター展開の両方で一貫していることがわかりました。 * ピーク IOPS で観測された差は、クラスター展開内のクライアント数が多いことに起因します。

Postgres を使用した VectorDB ベンチ (pgvecto.rs)

VectorDB-Bench を使用して PostgreSQL (pgvecto.rs) に対して次のアクションを実行しました。PostgreSQL (具体的には pgvecto.rs) のネットワークとサーバー接続に関する詳細は次のとおりです。

入出力ダイアログまたは書かれたコンテンツを示す図

このセクションでは、特に pgvecto.rs を使用して PostgreSQL データベースをテストした結果と観察結果を共有します。 * テスト時点では DiskANN が pgvecto.rs で利用できなかったため、これらのテストのインデックスタイプとして HNSW を選択しました。 * データ取り込みフェーズでは、768 次元の 1,000 万ベクトルで構成される Cohere データセットをロードしました。このプロセスには約 4.5 時間かかりました。 * クエリフェーズでは、1 秒あたりのクエリ数 (QPS) が 1,068、リコールが 0.6344 でした。クエリの 99 パーセンタイルレイテンシは 20 ミリ秒と測定されました。実行時間のほとんどを通じて、クライアントの CPU は 100% の能力で動作していました。

以下の画像は、ストレージクラスターのレイテンシ合計 IOPS (1 秒あたりの入出力操作数) など、さまざまなストレージメトリックを示しています。

入出力ダイアログまたは書かれたコンテンツを示す図

 The following section presents the key storage performance metrics.
image:pgvecto-storage-perf-metrics.png["入出力ダイアログまたは書かれたコンテンツを示す図"]

ベクターDBベンチにおけるmilvusとpostgresのパフォーマンス比較

入出力ダイアログまたは書かれたコンテンツを示す図

VectorDBBench を使用した Milvus と PostgreSQL のパフォーマンス検証に基づいて、次のことがわかりました。

インデックスタイプ: HNSW
データセット: 768次元の1000万ベクトルを含むCohere

pgvecto.rs は 1 秒あたりのクエリ数 (QPS) が 1,068、リコールが 0.6344 であったのに対し、Milvus は QPS が 106、リコールが 0.9842 であったことがわかりました。

クエリの高精度が優先される場合、Milvus はクエリごとに関連アイテムをより高い割合で取得するため、pgvecto.rs よりも優れています。しかし、1 秒あたりのクエリ数の方が重要な要素である場合、pgvecto.rs は Milvus を上回ります。ただし、pgvecto.rs 経由で取得されるデータの品質は低く、検索結果の約 37% が無関係な項目であることに注意することが重要です。

パフォーマンス検証に基づく観察:

パフォーマンス検証に基づいて、次のことが観察されました。

Milvus では、I/O プロファイルは、Oracle SLOB で見られるような OLTP ワークロードによく似ています。ベンチマークは、データ取り込み、事後最適化、クエリの 3 つのフェーズで構成されます。初期段階では主に 64 KB の書き込み操作が特徴で、クエリ段階では主に 8 KB の読み取りが行われます。 ONTAP がMilvus I/O 負荷を適切に処理することが期待されます。

PostgreSQL I/O プロファイルでは、困難なストレージワークロードは発生しません。現在進行中のメモリ内実装を考慮すると、クエリフェーズ中にディスク I/O は発生しませんでした。

DiskANN は、ストレージの差別化に重要なテクノロジーとして登場しました。システムメモリの境界を超えたベクトル DB 検索の効率的なスケーリングが可能になります。ただし、HNSW などのメモリ内ベクトル DB インデックスでは、ストレージパフォーマンスの差別化を確立できる可能性は低くなります。

また、インデックスタイプが HSNW の場合、RAG アプリケーションをサポートするベクターデータベースにとって最も重要な操作フェーズであるクエリフェーズでは、ストレージが重要な役割を果たしないことにも注目に値します。ここでの意味は、ストレージパフォーマンスがこれらのアプリケーションの全体的なパフォーマンスに大きな影響を与えないということです。

ベクターデータベースのパフォーマンス検証

Creating your file...

パフォーマンス検証

Milvus スタンドアロン クラスターを使用した VectorDB-Bench

milvus クラスターを使用した VectorDB-Bench

Postgres を使用した VectorDB ベンチ (pgvecto.rs)

ベクターDBベンチにおけるmilvusとpostgresのパフォーマンス比較

パフォーマンス検証に基づく観察:

Milvus スタンドアロンクラスターを使用した VectorDB-Bench