PEnG: Pose-Enhanced Geo-Localisation

要約

クロスビュー地理位置特定は、密にサンプリングされた衛星画像パッチが重なり合うため、通常、粗い粒度で実行されます。
この重なり合いが多いと、パッチの曖昧さを解消することが非常に困難になります。
ただし、まばらにサンプリングされたパッチを選択することにより、これまでの研究では、可能な位置特定精度に人為的な上限が設定されていました。
完璧なオラクル システムであっても、タイルの平均間隔を超える精度を達成することはできません。
この制限を解決するために、クロスビュー地理位置推定と相対姿勢推定を組み合わせて、実世界のアプリケーションで実用的なレベルまで精度を向上させることを提案します。
私たちは、最初にクエリ画像が存在する都市規模のグラフ表現から最も可能性の高いエッジを予測する 2 段階システムである PEnG を開発します。
次に、これらのエッジ内で相対姿勢推定を実行して、正確な位置を決定します。
PEnG は、クロスビュー地理位置情報データセット内で利用可能な両方の視点を利用してサブメートル レベルまで精度を向上させる最初の手法を提示し、いくつかの例ではセンチメートル レベルの精度を達成しています。
私たちが提案したアンサンブルは最先端の精度を実現し、上位 500 万件の検索が以前の作品と比較して 213% 向上しました。
90 度の水平 FOV 画像で評価した場合、中央ユークリッド距離誤差は、以前の最高値である 734 m から 22.77 m まで 96.90% 減少しました。
コードが利用可能になります: tavisshore.co.uk/PEnG

要約(オリジナル)

Cross-view Geo-localisation is typically performed at a coarse granularity, because densely sampled satellite image patches overlap heavily. This heavy overlap would make disambiguating patches very challenging. However, by opting for sparsely sampled patches, prior work has placed an artificial upper bound on the localisation accuracy that is possible. Even a perfect oracle system cannot achieve accuracy greater than the average separation of the tiles. To solve this limitation, we propose combining cross-view geo-localisation and relative pose estimation to increase precision to a level practical for real-world application. We develop PEnG, a 2-stage system which first predicts the most likely edges from a city-scale graph representation upon which a query image lies. It then performs relative pose estimation within these edges to determine a precise position. PEnG presents the first technique to utilise both viewpoints available within cross-view geo-localisation datasets to enhance precision to a sub-metre level, with some examples achieving centimetre level accuracy. Our proposed ensemble achieves state-of-the-art precision – with relative Top-5m retrieval improvements on previous works of 213%. Decreasing the median euclidean distance error by 96.90% from the previous best of 734m down to 22.77m, when evaluating with 90 degree horizontal FOV images. Code will be made available: tavisshore.co.uk/PEnG

arxiv情報

著者 Tavis Shore,Oscar Mendez,Simon Hadfield
発行日 2024-11-24 07:42:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク