要約
ベクトルデータベースは通常、ベクトルの埋め込みの大規模なコレクションを管理します。
現在、AIアプリケーションは急速に成長しており、保存してインデックス作成する必要がある埋め込みの数も増えています。
FAISSライブラリは、ベクトルデータベースのコア機能であるベクトル類似性検索に専念しています。
FAISSは、ベクトルの検索、クラスター、圧縮、変換に使用されるインデックス作成方法と関連するプリミティブのツールキットです。
このペーパーでは、構造、最適化へのアプローチ、インターフェースの観点から、ベクター検索のトレードオフスペースとFAISSの設計原則について説明します。
ライブラリの主要な機能をベンチマークし、いくつかの選択したアプリケーションについて議論して、その幅広い適用性を強調します。
要約(オリジナル)
Vector databases typically manage large collections of embedding vectors. Currently, AI applications are growing rapidly, and so is the number of embeddings that need to be stored and indexed. The Faiss library is dedicated to vector similarity search, a core functionality of vector databases. Faiss is a toolkit of indexing methods and related primitives used to search, cluster, compress and transform vectors. This paper describes the trade-off space of vector search and the design principles of Faiss in terms of structure, approach to optimization and interfacing. We benchmark key features of the library and discuss a few selected applications to highlight its broad applicability.
arxiv情報
著者 | Matthijs Douze,Alexandr Guzhva,Chengqi Deng,Jeff Johnson,Gergely Szilvasy,Pierre-Emmanuel Mazaré,Maria Lomeli,Lucas Hosseini,Hervé Jégou |
発行日 | 2025-02-11 17:43:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google