MegaLoc: One Retrieval to Place Them All

要約

特定のクエリと同じ場所から画像を取得することは、視覚的な場所認識、ランドマーク検索、視覚的ローカリゼーション、3D再建、スラムなど、複数のコンピュータービジョンタスクの重要なコンポーネントです。
ただし、既存のソリューションは、これらのタスクのいずれかに特に機能するように構築されており、要件がわずかに変更されたり、配布不足データを満たしているときに失敗することが知られています。
このペーパーでは、さまざまな既存の方法、トレーニング技術、およびデータセットを組み合わせて、複数のタスクで実行されるMegalocと呼ばれる検索モデルをトレーニングします。
Megaloc(1)は、多数の視覚的な場所認識データセットで最先端を達成し、(2)一般的なランドマーク検索データセットの印象的な結果を達成し、(3)Lamarでの視覚的ローカリゼーションのための新しい最新技術を設定することがわかります。
データセット。検索方法を既存のローカリゼーションパイプラインにのみ変更しました。
Megalocのコードは、https://github.com/gmberton/megalocで入手できます

要約(オリジナル)

Retrieving images from the same location as a given query is an important component of multiple computer vision tasks, like Visual Place Recognition, Landmark Retrieval, Visual Localization, 3D reconstruction, and SLAM. However, existing solutions are built to specifically work for one of these tasks, and are known to fail when the requirements slightly change or when they meet out-of-distribution data. In this paper we combine a variety of existing methods, training techniques, and datasets to train a retrieval model, called MegaLoc, that is performant on multiple tasks. We find that MegaLoc (1) achieves state of the art on a large number of Visual Place Recognition datasets, (2) impressive results on common Landmark Retrieval datasets, and (3) sets a new state of the art for Visual Localization on the LaMAR datasets, where we only changed the retrieval method to the existing localization pipeline. The code for MegaLoc is available at https://github.com/gmberton/MegaLoc

arxiv情報

著者 Gabriele Berton,Carlo Masone
発行日 2025-02-24 15:14:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク