Relative Distance Guided Dynamic Partition Learning for Scale-Invariant UAV-View Geo-Localization

要約

UAV-view Geo-Localization~(UVGL) は、特にドローンで撮影した画像と衛星の視点の間の視覚的な差異により、大きな課題を抱えています。
既存の方法は通常、異なるビュー間で一貫したスケーリング係数を前提としています。
したがって、事前定義されたパーティションの位置合わせを採用し、さまざまな部品レベルの機能を構築することで視点不変の表現を抽出します。
ただし、UAV の飛行状態の変動によりクロスビューのスケールの不一致が生じ、重大なパフォーマンスの低下が生じるという現実世界のシナリオでは、スケーリングの仮定が常に成り立つわけではありません。
この問題を解決するために、相対距離に基づくパーティション学習フレームワークを提案します。これにより、きめの細かい特徴をマイニングする際のスケールの一貫性への依存が軽減されます。
具体的には、正方形分割戦略と距離ガイド付き調整戦略からなる距離ガイド付き動的分割学習戦略 (DGDPL) を提案します。
前者は、簡単な方法で詳細な特徴と全体的な特徴を抽出するために利用されます。
後者は、ドローンビューと衛星ビューの間の相対距離比を計算してパーティション サイズを調整し、それによってパーティション ペア間のセマンティック情報を明示的に調整します。
さらに、検索精度をさらに向上させるために、部品レベルの特徴を洗練するための顕著性に基づく洗練戦略を提案します。
広範な実験により、私たちのアプローチは、スケールが一致しないさまざまなシナリオにわたって優れた地理位置特定精度を達成し、スケールの変動に対して顕著なロバスト性を示すことが示されています。
コードが公開されます。

要約(オリジナル)

UAV-view Geo-Localization~(UVGL) presents substantial challenges, particularly due to the disparity in visual appearance between drone-captured imagery and satellite perspectives. Existing methods usually assume consistent scaling factor across different views. Therefore, they adopt predefined partition alignment and extract viewpoint-invariant representation by constructing a variety of part-level features. However, the scaling assumption is not always hold in the real-world scenarios that variations of UAV flight state leads to the scale mismatch of cross-views, resulting in serious performance degradation. To overcome this issue, we propose a partition learning framework based on relative distance, which alleviates the dependence on scale consistency while mining fine-grained features. Specifically, we propose a distance guided dynamic partition learning strategy~(DGDPL), consisting of a square partition strategy and a distance-guided adjustment strategy. The former is utilized to extract fine-grained features and global features in a simple manner. The latter calculates the relative distance ratio between drone- and satellite-view to adjust the partition size, thereby explicitly aligning the semantic information between partition pairs. Furthermore, we propose a saliency-guided refinement strategy to refine part-level features, so as to further improve the retrieval accuracy. Extensive experiments show that our approach achieves superior geo-localization accuracy across various scale-inconsistent scenarios, and exhibits remarkable robustness against scale variations. The code will be released.

arxiv情報

著者 Quan Chen,Tingyu Wang,Rongfeng Lu,Bolun Zheng,Zhedong Zheng,Chenggang Yan
発行日 2024-12-23 14:17:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク