Long-distance Geomagnetic Navigation in GNSS-denied Environments with Deep Reinforcement Learning

要約

地磁気ナビゲーションは、複雑な環境をナビゲートできる能力と、全地球測位衛星システム (GNSS) などの外部ナビゲーション サービスから独立しているため、ますます注目を集めています。
地磁気ナビゲーションに関する既存の研究、つまりマッチングナビゲーションとバイオニックナビゲーションは、事前に保存された地図または広範な検索に依存しているため、未踏の領域での適用性が制限されたり、ナビゲーション効率が低下したりします。
GNSS が利用できない地域における地磁気ナビゲーションの問題に対処するために、この論文では、特に長距離の地磁気ナビゲーションのための深層強化学習 (DRL) ベースのメカニズムを開発します。
この設計されたメカニズムは、事前に保存された地図や大規模で高価な検索アプローチを使用するのではなく、地磁気ナビゲーションのための磁気受信能力を学習して獲得するようにエージェントを訓練します。
特に、地磁気勾配に基づく平行アプローチを地磁気ナビゲーションに統合します。
この統合により、取得された勾配が目的地に向かって揃うように地磁気勾配を調整することで、学習エージェントの過剰探索が軽減されます。
提案されたアプローチの有効性を詳細な数値シミュレーションを通じて調査し、提案されたアプローチを実現する際にツイン遅延深決定性政策勾配(TD3)を実装します。
この結果は、私たちのアプローチが、多様なナビゲーション条件下での長距離ミッションにおいて、既存のメタヒューリスティックおよびバイオニックナビゲーション手法を上回るパフォーマンスを発揮することを示しています。

要約(オリジナル)

Geomagnetic navigation has drawn increasing attention with its capacity in navigating through complex environments and its independence from external navigation services like global navigation satellite systems (GNSS). Existing studies on geomagnetic navigation, i.e., matching navigation and bionic navigation, rely on pre-stored map or extensive searches, leading to limited applicability or reduced navigation efficiency in unexplored areas. To address the issues with geomagnetic navigation in areas where GNSS is unavailable, this paper develops a deep reinforcement learning (DRL)-based mechanism, especially for long-distance geomagnetic navigation. The designed mechanism trains an agent to learn and gain the magnetoreception capacity for geomagnetic navigation, rather than using any pre-stored map or extensive and expensive searching approaches. Particularly, we integrate the geomagnetic gradient-based parallel approach into geomagnetic navigation. This integration mitigates the over-exploration of the learning agent by adjusting the geomagnetic gradient, such that the obtained gradient is aligned towards the destination. We explore the effectiveness of the proposed approach via detailed numerical simulations, where we implement twin delayed deep deterministic policy gradient (TD3) in realizing the proposed approach. The results demonstrate that our approach outperforms existing metaheuristic and bionic navigation methods in long-distance missions under diverse navigation conditions.

arxiv情報

著者 Wenqi Bai,Xiaohui Zhang,Shiliang Zhang,Songnan Yang,Yushuai Li,Tingwen Huang
発行日 2024-10-21 09:57:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク