Deep Reinforcement Learning with Dynamic Graphs for Adaptive Informative Path Planning

要約

自律型ロボットは、その効率性と人件費の低さから、データ収集によく使用されます。
ロボットデータ収集における重要なタスクは、バッテリー寿命の制限など、プラットフォーム固有のリソース制約を考慮して、最初は未知の環境を通る経路を計画して観測値を収集することです。
3D 環境での適応型オンライン パス プランニングは、有効なアクションが多数存在し、未知のオクルージョンが存在するため、困難を伴います。
これらの問題に対処するために、未知の 3D 環境で関心のあるターゲットをマッピングするためにロボットの経路を適応的に再計画するための新しい深層強化学習アプローチを提案します。
私たちのアプローチの重要な側面は、ロボットにローカルな計画アクションを制限する動的に構築されたグラフです。これにより、新たに発見された障害物や関心のあるターゲットに迅速に対応できるようになります。
再計画のために、未知の環境の探索と、オンラインで収集された対象ターゲットに関するデータの活用とのバランスを取る新しい報酬関数を提案します。
私たちの実験は、私たちの方法が最先端の学習ベースラインおよび非学習ベースラインと比較して、より効率的なターゲット検出を可能にすることを示しています。
また、写真のようにリアルなシミュレーターで無人航空機を使用した果樹園モニタリングへのアプローチの適用可能性も示します。

要約(オリジナル)

Autonomous robots are often employed for data collection due to their efficiency and low labour costs. A key task in robotic data acquisition is planning paths through an initially unknown environment to collect observations given platform-specific resource constraints, such as limited battery life. Adaptive online path planning in 3D environments is challenging due to the large set of valid actions and the presence of unknown occlusions. To address these issues, we propose a novel deep reinforcement learning approach for adaptively replanning robot paths to map targets of interest in unknown 3D environments. A key aspect of our approach is a dynamically constructed graph that restricts planning actions local to the robot, allowing us to quickly react to newly discovered obstacles and targets of interest. For replanning, we propose a new reward function that balances between exploring the unknown environment and exploiting online-collected data about the targets of interest. Our experiments show that our method enables more efficient target detection compared to state-of-the-art learning and non-learning baselines. We also show the applicability of our approach for orchard monitoring using an unmanned aerial vehicle in a photorealistic simulator.

arxiv情報

著者 Apoorva Vashisth,Julius Rückin,Federico Magistri,Cyrill Stachniss,Marija Popović
発行日 2024-02-07 14:24:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク