要約
ベクトル データベースは通常、埋め込みベクトルの大規模なコレクションを管理します。
現在、AI アプリケーションは急速に成長しており、保存およびインデックス付けが必要なエンベディングの数も増加しています。
Faiss ライブラリは、ベクトル データベースの中核機能であるベクトル類似性検索専用です。
Faiss は、ベクトルの検索、クラスタ化、圧縮、変換に使用されるインデックス付けメソッドと関連プリミティブのツールキットです。
この文書では、ベクトル検索のトレードオフ空間と、構造、最適化へのアプローチ、およびインターフェースの観点からの Faiss の設計原則について説明します。
ライブラリの主要な機能をベンチマークし、その広範な適用可能性を強調するために、いくつかの選択したアプリケーションについて説明します。
要約(オリジナル)
Vector databases typically manage large collections of embedding vectors. Currently, AI applications are growing rapidly, and so is the number of embeddings that need to be stored and indexed. The Faiss library is dedicated to vector similarity search, a core functionality of vector databases. Faiss is a toolkit of indexing methods and related primitives used to search, cluster, compress and transform vectors. This paper describes the trade-off space of vector search and the design principles of Faiss in terms of structure, approach to optimization and interfacing. We benchmark key features of the library and discuss a few selected applications to highlight its broad applicability.
arxiv情報
| 著者 | Matthijs Douze,Alexandr Guzhva,Chengqi Deng,Jeff Johnson,Gergely Szilvasy,Pierre-Emmanuel Mazaré,Maria Lomeli,Lucas Hosseini,Hervé Jégou |
| 発行日 | 2024-09-06 15:08:03+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google