The Faiss library

要約

ベクトル データベースは、埋め込みベクトルの大規模なコレクションを管理します。
AI アプリケーションが急速に成長するにつれて、保存およびインデックス付けが必要なエンベディングの数も増加しています。
Faiss ライブラリは、ベクトル データベースの中核機能であるベクトル類似性検索専用です。
Faiss は、ベクトルの検索、クラスタ化、圧縮、変換に使用されるインデックス付けメソッドと関連プリミティブのツールキットです。
この論文では、まずベクトル検索のトレードオフ空間について説明し、次に構造、最適化へのアプローチ、およびインターフェイスに関する Faiss の設計原則について説明します。
ライブラリの主要な機能をベンチマークし、その広範な適用可能性を強調するために、いくつかの選択したアプリケーションについて説明します。

要約(オリジナル)

Vector databases manage large collections of embedding vectors. As AI applications are growing rapidly, so are the number of embeddings that need to be stored and indexed. The Faiss library is dedicated to vector similarity search, a core functionality of vector databases. Faiss is a toolkit of indexing methods and related primitives used to search, cluster, compress and transform vectors. This paper first describes the tradeoff space of vector search, then the design principles of Faiss in terms of structure, approach to optimization and interfacing. We benchmark key features of the library and discuss a few selected applications to highlight its broad applicability.

arxiv情報

著者 Matthijs Douze,Alexandr Guzhva,Chengqi Deng,Jeff Johnson,Gergely Szilvasy,Pierre-Emmanuel Mazaré,Maria Lomeli,Lucas Hosseini,Hervé Jégou
発行日 2024-01-16 11:12:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.SE パーマリンク