UAV-VisLoc: A Large-scale Dataset for UAV Visual Localization

要約

無人航空機 (UAV) の用途は最近広く拡張されています。
特に全地球測位衛星システム (GNSS) が中断され信頼性が低い場合には、UAV の正確な緯度と経度の座標を確保することが重要です。
既存の視覚的位置特定手法は、UAV の地上ビュー画像とオルソ衛星地図を照合することにより、誤差が蓄積することなく自律的な視覚的位置特定を実現します。
ただし、さまざまな場所で UAV の地上ビュー画像を収集するにはコストがかかり、現実世界のシナリオに対応する大規模なデータセットが不足します。
UAV の視覚的位置特定用の既存のデータセットは、多くの場合、狭い地理的エリアに限定されているか、独特のテクスチャを持つ都市部のみに焦点を当てています。
これに対処するために、キャプチャされた地上ビューに基づいて大規模衛星地図上の UAV の実際の位置座標を決定することにより、UAV の視覚的位置特定タスクを定義します。
この論文では、UAV の視覚的位置特定タスクを容易にする大規模データセット UAV-VisLoc を紹介します。
このデータセットは、中国の 11 か所にわたるさまざまなドローンからの画像で構成されており、さまざまな地形特徴を捉えています。
このデータセットには、さまざまな高度と方向で撮影された、固定翼ドローンとマルチテレイン ドローンからの画像が含まれています。
当社のデータセットには、緯度、経度、高度、撮影日などのメタデータを含む 6,742 枚のドローン画像と 11 枚の衛星地図が含まれています。
当社のデータセットは、多様で広範なデータを提供することにより、モデルのトレーニングとテストの両方をサポートするように調整されています。

要約(オリジナル)

The application of unmanned aerial vehicles (UAV) has been widely extended recently. It is crucial to ensure accurate latitude and longitude coordinates for UAVs, especially when the global navigation satellite systems (GNSS) are disrupted and unreliable. Existing visual localization methods achieve autonomous visual localization without error accumulation by matching the ground-down view image of UAV with the ortho satellite maps. However, collecting UAV ground-down view images across diverse locations is costly, leading to a scarcity of large-scale datasets for real-world scenarios. Existing datasets for UAV visual localization are often limited to small geographic areas or are focused only on urban regions with distinct textures. To address this, we define the UAV visual localization task by determining the UAV’s real position coordinates on a large-scale satellite map based on the captured ground-down view. In this paper, we present a large-scale dataset, UAV-VisLoc, to facilitate the UAV visual localization task. This dataset comprises images from diverse drones across 11 locations in China, capturing a range of topographical features. The dataset features images from fixed-wing drones and multi-terrain drones, captured at different altitudes and orientations. Our dataset includes 6,742 drone images and 11 satellite maps, with metadata such as latitude, longitude, altitude, and capture date. Our dataset is tailored to support both the training and testing of models by providing a diverse and extensive data.

arxiv情報

著者 Wenjia Xu,Yaxuan Yao,Jiaqi Cao,Zhiwei Wei,Chunbo Liu,Jiuniu Wang,Mugen Peng
発行日 2024-05-20 10:24:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク