Target Search and Navigation in Heterogeneous Robot Systems with Deep Reinforcement Learning

要約

協調的な異種ロボット システムは、ターゲットの検索およびナビゲーション タスクの効率を大幅に向上させることができます。
この論文では、未知の環境での捜索救助任務のために、UAV と UGV から構成される異種ロボット システムを設計します。
このシステムは、深層強化学習アルゴリズムを通じて学習したポリシーを使用して、迷路のような鉱山環境でターゲットを検索し、ターゲットに移動することができます。
訓練プロセス中に 2 台のロボットが同時に訓練されると、それらの協力に関連する報酬が適切に得られない可能性があります。
そこで、エージェントが未訪問の環境を探索することを奨励するために、多段階の強化学習フレームワークと好奇心モジュールを導入します。
シミュレーション環境での実験では、既存のベースラインでは実現できない可能性があるにもかかわらず、未知のターゲット位置での検索とナビゲーションを達成するために、私たちのフレームワークが異種ロボット システムをトレーニングでき、トレーニング速度を加速できることが示されています。

要約(オリジナル)

Collaborative heterogeneous robot systems can greatly improve the efficiency of target search and navigation tasks. In this paper, we design a heterogeneous robot system consisting of a UAV and a UGV for search and rescue missions in unknown environments. The system is able to search for targets and navigate to them in a maze-like mine environment with the policies learned through deep reinforcement learning algorithms. During the training process, if two robots are trained simultaneously, the rewards related to their collaboration may not be properly obtained. Hence, we introduce a multi-stage reinforcement learning framework and a curiosity module to encourage agents to explore unvisited environments. Experiments in simulation environments show that our framework can train the heterogeneous robot system to achieve the search and navigation with unknown target locations while existing baselines may not, and accelerate the training speed.

arxiv情報

著者 Yun Chen,Jiaping Xiao
発行日 2023-08-01 07:09:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク