Robot path planning using deep reinforcement learning

要約

自律ナビゲーションは、特に未知の環境では移動ロボットにとって困難です。
一般に、ロボットは、環境をマッピングし、自身の位置を特定し、ターゲットに到達するための計画を立てるために、複数のセンサーを必要とします。
ただし、強化学習手法は、実行する最適なアクションを学習することにより、マップを使用しないナビゲーション タスクの代替手段を提供します。
この記事では、ディープ Q ネットワーク手法のバリアントである D3QN アルゴリズムとレインボー アルゴリズムを使用して、深層強化学習エージェントを実装し、障害物回避と目標指向ナビゲーション タスクの両方を実現します。
エージェントは、シミュレートされた環境でトレーニングおよび評価されます。
さらに、報酬関数の変更によるエージェントの行動とパフォーマンスの変化の分析が行われます。

要約(オリジナル)

Autonomous navigation is challenging for mobile robots, especially in an unknown environment. Commonly, the robot requires multiple sensors to map the environment, locate itself, and make a plan to reach the target. However, reinforcement learning methods offer an alternative to map-free navigation tasks by learning the optimal actions to take. In this article, deep reinforcement learning agents are implemented using variants of the deep Q networks method, the D3QN and rainbow algorithms, for both the obstacle avoidance and the goal-oriented navigation task. The agents are trained and evaluated in a simulated environment. Furthermore, an analysis of the changes in the behaviour and performance of the agents caused by modifications in the reward function is conducted.

arxiv情報

著者 Miguel Quinones-Ramirez,Jorge Rios-Martinez,Victor Uc-Cetina
発行日 2023-02-17 20:08:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク