要約
低高度経済(LAE)をサポートするために、世界的なポジショニングシステム(GPS)シグナルが利用できない都市部における正確な無人航空機(UAV)のローカリゼーションをサポートするため。
ビジョンベースの方法は、実行可能な代替手段を提供しますが、軽量UAVの深刻な帯域幅、メモリ、処理の制約に直面しています。
哺乳類の空間認知に触発されて、マルチカメラシステムを装備したUAVがコンパクトなマルチビュー機能とエッジサーバーへのオフロードローカリゼーションタスクを抽出するタスク指向のコミュニケーションフレームワークを提案します。
直交関連のバリエーション情報ボトルネックエンコーダ(O-VIB)を紹介します。これには、オートマティックな関連性決定(ARD)が組み込まれ、非情報機能を整理しながら、冗長性を最小限に抑えます。
これにより、伝送コストを最小限に抑えて効率的かつ正確なローカリゼーションが可能になります。
専用のLAE UAVデータセットの広範な評価は、O-VIBが厳しい帯域幅予算の下で高精度のローカリゼーションを達成することを示しています。
コードとデータセットは、github.com/fangzr/toc-edge-aerial:github.com/fangzr/toc-edge-aerialに公開されます。
要約(オリジナル)
To support the Low Altitude Economy (LAE), precise unmanned aerial vehicles (UAVs) localization in urban areas where global positioning system (GPS) signals are unavailable. Vision-based methods offer a viable alternative but face severe bandwidth, memory and processing constraints on lightweight UAVs. Inspired by mammalian spatial cognition, we propose a task-oriented communication framework, where UAVs equipped with multi-camera systems extract compact multi-view features and offload localization tasks to edge servers. We introduce the Orthogonally-constrained Variational Information Bottleneck encoder (O-VIB), which incorporates automatic relevance determination (ARD) to prune non-informative features while enforcing orthogonality to minimize redundancy. This enables efficient and accurate localization with minimal transmission cost. Extensive evaluation on a dedicated LAE UAV dataset shows that O-VIB achieves high-precision localization under stringent bandwidth budgets. Code and dataset will be made publicly available: github.com/fangzr/TOC-Edge-Aerial.
arxiv情報
著者 | Zhengru Fang,Zhenghao Liu,Jingjing Wang,Senkang Hu,Yu Guo,Yiqin Deng,Yuguang Fang |
発行日 | 2025-04-25 12:49:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google