Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy

要約

低高度経済(LAE)を支援するため、全地球測位システム(GPS)信号が利用できない都市部での正確な無人航空機(UAV)の位置特定が必要である。ビジョンベースの方法は実行可能な代替手段を提供するが、軽量UAVでは帯域幅、メモリ、処理の厳しい制約に直面する。哺乳類の空間認知にヒントを得て、マルチカメラシステムを搭載したUAVがコンパクトなマルチビューの特徴を抽出し、ローカライゼーションタスクをエッジサーバーにオフロードする、タスク指向のコミュニケーションフレームワークを提案する。このエンコーダは、冗長性を最小化するために直交性を強制する一方で、非情報的な特徴を除去するために自動関連性決定(ARD)を組み込んでいる。これにより、最小限の伝送コストで効率的かつ正確な位置特定が可能になる。LAE UAV データセットを用いた広範な評価により、O-VIB は厳しい帯域幅バジェットの下でも高精度なローカライゼーションを実現することが示されました。コードとデータセットは、github.com/fangzr/TOC-Edge-Aerialで公開予定。

要約(オリジナル)

To support the Low Altitude Economy (LAE), precise unmanned aerial vehicles (UAVs) localization in urban areas where global positioning system (GPS) signals are unavailable. Vision-based methods offer a viable alternative but face severe bandwidth, memory and processing constraints on lightweight UAVs. Inspired by mammalian spatial cognition, we propose a task-oriented communication framework, where UAVs equipped with multi-camera systems extract compact multi-view features and offload localization tasks to edge servers. We introduce the Orthogonally-constrained Variational Information Bottleneck encoder (O-VIB), which incorporates automatic relevance determination (ARD) to prune non-informative features while enforcing orthogonality to minimize redundancy. This enables efficient and accurate localization with minimal transmission cost. Extensive evaluation on a dedicated LAE UAV dataset shows that O-VIB achieves high-precision localization under stringent bandwidth budgets. Code and dataset will be made publicly available: github.com/fangzr/TOC-Edge-Aerial.

arxiv情報

著者 Zhengru Fang,Zhenghao Liu,Jingjing Wang,Senkang Hu,Yu Guo,Yiqin Deng,Yuguang Fang
発行日 2025-05-02 08:32:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.NI パーマリンク