要約
この作業では、3Dスペースの適応的な有益なパス計画(IPP)問題に対処するための注意ベースのディープ強化学習アプローチを提案します。そこでは、下向きセンサーを装備した航空ロボットが3D位置をダイナミックに調整してセンシングフットプリントと精度のバランスをとる必要があります。
適応型IPPタスクでは、エージェントは、時間/距離の制約の下で収集された情報を最大化し、新たに獲得したセンサーデータに基づいてパスを継続的に適応させる任務を負います。
この目的のために、私たちは、大きなアクション空間全体でグローバルな空間的依存関係をキャプチャする強力な能力のために注意メカニズムを活用し、エージェントが環境移行の暗黙の推定を学ぶことができるようにします。
私たちのモデルは、ドメイン全体にわたってコンテキスト信念表現を構築し、短期および長期の検索目標の両方を最適化するシーケンシャルな動きの決定をガイドします。
最先端のプランナーに対する比較評価は、私たちのアプローチが制約された予算内の環境の不確実性を大幅に減らすため、エージェントが探索と搾取のバランスをとることができることを示しています。
さらに、モデルがさまざまなサイズの環境によく一般化し、多くの実際のアプリケーションの可能性を強調していることを示しています。
要約(オリジナル)
In this work, we propose an attention-based deep reinforcement learning approach to address the adaptive informative path planning (IPP) problem in 3D space, where an aerial robot equipped with a downward-facing sensor must dynamically adjust its 3D position to balance sensing footprint and accuracy, and finally obtain a high-quality belief of an underlying field of interest over a given domain (e.g., presence of specific plants, hazardous gas, geological structures, etc.). In adaptive IPP tasks, the agent is tasked with maximizing information collected under time/distance constraints, continuously adapting its path based on newly acquired sensor data. To this end, we leverage attention mechanisms for their strong ability to capture global spatial dependencies across large action spaces, allowing the agent to learn an implicit estimation of environmental transitions. Our model builds a contextual belief representation over the entire domain, guiding sequential movement decisions that optimize both short- and long-term search objectives. Comparative evaluations against state-of-the-art planners demonstrate that our approach significantly reduces environmental uncertainty within constrained budgets, thus allowing the agent to effectively balance exploration and exploitation. We further show our model generalizes well to environments of varying sizes, highlighting its potential for many real-world applications.
arxiv情報
著者 | Rui Zhao,Xingjian Zhang,Yuhong Cao,Yizhuo Wang,Guillaume Sartoretti |
発行日 | 2025-06-10 04:16:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google