Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search

要約

高次元空間における近似最近傍探索 (ANNS) は、機械学習の分野における極めて重要な課題です。
近年、グラフベースの手法が ANNS に対する優れたアプローチとして台頭し、新たな最先端技術を確立しました。
グラフベースの ANNS のさまざまな最適化が導入されていますが、それらは主に正式な理論的裏付けのないヒューリスティックな手法に依存しています。
この論文は、グラフ内のノードの隣接ノードを探索する際に確率的保証を提供する方法を導入することにより、グラフベースの ANNS 内のルーティングを強化することを目的としています。
私たちは問題を確率的ルーティングとして定式化し、局所性を考慮した手法を組み込むことによって 2 つのベースライン戦略を開発します。
続いて、グラフ内のどの近傍を正確な距離の計算に考慮すべきかを効率的に特定する新しいアプローチである PEO を導入し、実際の効率を大幅に向上させます。
私たちの実験では、PEO を装備すると、一般的に使用されるグラフ インデックス (HNSW および NSSG) のスループットが 1.6 ~ 2.5 倍向上し、その効率は常に最先端のルーティング技術を 1.1 ~ 1.4 倍上回ることが実証されました。

要約(オリジナル)

Approximate nearest neighbor search (ANNS) in high-dimensional spaces is a pivotal challenge in the field of machine learning. In recent years, graph-based methods have emerged as the superior approach to ANNS, establishing a new state of the art. Although various optimizations for graph-based ANNS have been introduced, they predominantly rely on heuristic methods that lack formal theoretical backing. This paper aims to enhance routing within graph-based ANNS by introducing a method that offers a probabilistic guarantee when exploring a node’s neighbors in the graph. We formulate the problem as probabilistic routing and develop two baseline strategies by incorporating locality-sensitive techniques. Subsequently, we introduce PEOs, a novel approach that efficiently identifies which neighbors in the graph should be considered for exact distance calculation, thus significantly improving efficiency in practice. Our experiments demonstrate that equipping PEOs can increase throughput on commonly utilized graph indexes (HNSW and NSSG) by a factor of 1.6 to 2.5, and its efficiency consistently outperforms the leading-edge routing technique by 1.1 to 1.4 times.

arxiv情報

著者 Kejing Lu,Chuan Xiao,Yoshiharu Ishikawa
発行日 2024-07-10 17:05:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.DB, cs.DS, cs.LG パーマリンク