要約
ベクトル検索は、多くの現実世界のアプリケーションで重要な役割を果たします。
単一ベクトル検索に加えて、今日のマルチモーダルおよびマルチフィーチャーシナリオにとってマルチベクトル検索が重要になります。
マルチベクトルデータベースでは、各行はアイテムであり、各列はアイテムの機能を表し、各セルは高次元ベクトルです。
マルチベクトルデータベースでは、インデックスの選択がパフォーマンスに大きな影響を与える可能性があります。
リレーショナルデータベースのインデックスチューニングは広範囲に調査されていますが、マルチベクトル検索のインデックスチューニングは不明確で困難なままです。
この論文では、マルチベクトル検索インデックスのチューニングを定義し、それを解決するためのフレームワークを提案します。
具体的には、マルチベクトル検索ワークロードを考慮して、アルゴリズムを開発して、レイテンシを最小限に抑え、ストレージとリコールの制約を満たすインデックスを見つけます。
ベースラインと比較して、私たちの待ち時間は2.1倍から8.3倍のスピードアップを達成します。
要約(オリジナル)
Vector search plays a crucial role in many real-world applications. In addition to single-vector search, multi-vector search becomes important for multi-modal and multi-feature scenarios today. In a multi-vector database, each row is an item, each column represents a feature of items, and each cell is a high-dimensional vector. In multi-vector databases, the choice of indexes can have a significant impact on performance. Although index tuning for relational databases has been extensively studied, index tuning for multi-vector search remains unclear and challenging. In this paper, we define multi-vector search index tuning and propose a framework to solve it. Specifically, given a multi-vector search workload, we develop algorithms to find indexes that minimize latency and meet storage and recall constraints. Compared to the baseline, our latency achieves 2.1X to 8.3X speedup.
arxiv情報
| 著者 | Jiongli Zhu,Yue Wang,Bailu Ding,Philip A. Bernstein,Vivek Narasayya,Surajit Chaudhuri |
| 発行日 | 2025-04-28 17:36:06+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google