TBPos: Dataset for Large-Scale Precision Visual Localization

要約

画像ベースのローカリゼーションは、いくつかのよく知られているデータセットを使用する、古典的なコンピューター ビジョンの課題です。
一般に、データセットは、モデル化された風景をキャプチャするビジュアル 3D データベースと、3D ポーズを検出するクエリ画像で構成されます。
通常、クエリ画像は、3D データベースの収集に使用されるイメージング ハードウェアとは異なるカメラで取得されています。
その結果、クエリ画像と 3D データベースの間で正確なグラウンド トゥルース ポーズを取得することは困難です。
ビジュアル ローカリゼーション アルゴリズムの精度が常に向上するにつれて、正確なグラウンド トゥルースがますます重要になります。
この論文では、TBPos を提案します。TBPos は、画像ベースのポジショニングのための新しい大規模なビジュアル データセットであり、クエリ画像に完全に正確なグラウンド トゥルース ポーズを提供します。データベース画像とクエリ画像の両方が、同じレーザー スキャナー データから派生しています。
この論文の実験的な部分では、提案されたデータセットが画像ベースのローカリゼーション パイプラインによって評価されます。

要約(オリジナル)

Image based localization is a classical computer vision challenge, with several well-known datasets. Generally, datasets consist of a visual 3D database that captures the modeled scenery, as well as query images whose 3D pose is to be discovered. Usually the query images have been acquired with a camera that differs from the imaging hardware used to collect the 3D database; consequently, it is hard to acquire accurate ground truth poses between query images and the 3D database. As the accuracy of visual localization algorithms constantly improves, precise ground truth becomes increasingly important. This paper proposes TBPos, a novel large-scale visual dataset for image based positioning, which provides query images with fully accurate ground truth poses: both the database images and the query images have been derived from the same laser scanner data. In the experimental part of the paper, the proposed dataset is evaluated by means of an image-based localization pipeline.

arxiv情報

著者 Masud Fahim,Ilona Söchting,Luca Ferranti,Juho Kannala,Jani Boutellier
発行日 2023-02-20 08:14:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク