Wide-Area Geolocalization with a Limited Field of View Camera

要約

GPS の補足または代替となるクロスビュー地理位置特定は、地上カメラから撮影した画像と衛星または航空機から撮影した頭上画像を照合することにより、探索エリア内のエージェントの位置を特定します。
地上画像と頭上画像の間の視点の違いにより、クロスビューの地理的位置特定が困難になりますが、地上エージェントがパノラマ カメラにアクセスできることを前提として、大幅な進歩が見られました。
たとえば、以前の研究 (WAG) では、検索エリアの離散化、トレーニング損失、および粒子フィルターの重み付けに変更を導入し、都市規模のパノラマ クロスビュー地理位置特定を可能にしました。
ただし、パノラマ カメラは、その複雑さとコストのため、既存のロボット プラットフォームでは広く使用されていません。
非パノラマのクロスビュー地理位置特定はロボット工学により適していますが、より困難でもあります。
この論文では、ポーズ認識埋め込みを作成し、粒子ポーズをシャム ネットワークに組み込む戦略を提供することにより、標準的な非パノラマ地上カメラで使用するために WAG を一般化するクロスビュー地理位置特定アプローチである制限付き FOV 広域地理位置特定 (ReWAG) について説明します。

ReWAG は、ニューラル ネットワークと粒子フィルター システムであり、オドメトリと 90 度 FOV カメラのみを使用して、GPS が拒否された環境でモバイル エージェントの位置をグローバルに特定することができ、WAG がパノラマ カメラで達成したものと同様の位置特定精度を達成し、位置特定精度を向上させます。
ベースライン ビジョン トランスフォーマー (ViT) アプローチと比較して 100 倍です。
数十キロメートルのテスト パスでの ReWAG の収束を示すビデオ ハイライトは、https://youtu.be/U_OBQrt8qCE でご覧いただけます。

要約(オリジナル)

Cross-view geolocalization, a supplement or replacement for GPS, localizes an agent within a search area by matching images taken from a ground-view camera to overhead images taken from satellites or aircraft. Although the viewpoint disparity between ground and overhead images makes cross-view geolocalization challenging, significant progress has been made assuming that the ground agent has access to a panoramic camera. For example, our prior work (WAG) introduced changes in search area discretization, training loss, and particle filter weighting that enabled city-scale panoramic cross-view geolocalization. However, panoramic cameras are not widely used in existing robotic platforms due to their complexity and cost. Non-panoramic cross-view geolocalization is more applicable for robotics, but is also more challenging. This paper presents Restricted FOV Wide-Area Geolocalization (ReWAG), a cross-view geolocalization approach that generalizes WAG for use with standard, non-panoramic ground cameras by creating pose-aware embeddings and providing a strategy to incorporate particle pose into the Siamese network. ReWAG is a neural network and particle filter system that is able to globally localize a mobile agent in a GPS-denied environment with only odometry and a 90 degree FOV camera, achieving similar localization accuracy as what WAG achieved with a panoramic camera and improving localization accuracy by a factor of 100 compared to a baseline vision transformer (ViT) approach. A video highlight that demonstrates ReWAG’s convergence on a test path of several dozen kilometers is available at https://youtu.be/U_OBQrt8qCE.

arxiv情報

著者 Lena M. Downes,Ted J. Steiner,Rebecca L. Russell,Jonathan P. How
発行日 2023-05-18 14:41:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク