MINT: Multi-Vector Search Index Tuning

要約

ベクトル検索は、多くの現実世界のアプリケーションで重要な役割を果たします。
単一ベクトル検索に加えて、今日のマルチモーダルおよびマルチフィーチャーシナリオにとってマルチベクトル検索が重要になります。
マルチベクトルデータベースでは、各行はアイテムであり、各列はアイテムの機能を表し、各セルは高次元ベクトルです。
マルチベクトルデータベースでは、インデックスの選択がパフォーマンスに大きな影響を与える可能性があります。
リレーショナルデータベースのインデックスチューニングは広範囲に調査されていますが、マルチベクトル検索のインデックスチューニングは不明確で困難なままです。
この論文では、マルチベクトル検索インデックスのチューニングを定義し、それを解決するためのフレームワークを提案します。
具体的には、マルチベクトル検索ワークロードを考慮して、アルゴリズムを開発して、レイテンシを最小限に抑え、ストレージとリコールの制約を満たすインデックスを見つけます。
ベースラインと比較して、私たちの待ち時間は2.1倍から8.3倍のスピードアップを達成します。

要約(オリジナル)

Vector search plays a crucial role in many real-world applications. In addition to single-vector search, multi-vector search becomes important for multi-modal and multi-feature scenarios today. In a multi-vector database, each row is an item, each column represents a feature of items, and each cell is a high-dimensional vector. In multi-vector databases, the choice of indexes can have a significant impact on performance. Although index tuning for relational databases has been extensively studied, index tuning for multi-vector search remains unclear and challenging. In this paper, we define multi-vector search index tuning and propose a framework to solve it. Specifically, given a multi-vector search workload, we develop algorithms to find indexes that minimize latency and meet storage and recall constraints. Compared to the baseline, our latency achieves 2.1X to 8.3X speedup.

arxiv情報

著者 Jiongli Zhu,Yue Wang,Bailu Ding,Philip A. Bernstein,Vivek Narasayya,Surajit Chaudhuri
発行日 2025-04-28 17:36:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB パーマリンク