When to Replan? An Adaptive Replanning Strategy for Autonomous Navigation using Deep Reinforcement Learning

要約

グローバル プランナーとローカル プランナーの階層は、自律ロボット ナビゲーションで最も一般的に使用されるシステム設計の 1 つです。
グローバル プランナーは、事前に構築されたマップに基づいて現在位置からゴール位置までの基準経路を生成しますが、ローカル プランナーは、認識された障害物を回避しながら基準経路に従う運動力学的軌道を生成します。
事前に作成された地図には存在しない予期せぬ障害物や動的な障害物を考慮して、基準経路を「いつ再計画するか」が、安全で効率的なナビゲーションを成功させるために重要です。
ただし、このような部分的に未知の環境で再計画を実行する理想的なタイミングを決定することは、依然として未解決の問題です。
この研究では、まず大規模なシミュレーション実験を行って、いくつかの一般的な再計画戦略を比較し、効果的な戦略は環境およびグローバルおよびローカルの計画立案者に大きく依存することを確認します。
この洞察に基づいて、深層強化学習に基づいた新しい適応的再計画戦略を導き出します。この戦略は、経験から学習して、特定の環境および計画セットアップにおける適切な再計画のタイミングを決定できます。
私たちの実験結果は、提案された再プランナーが、ナビゲーションの堅牢性と効率に関して、さまざまな状況において現在の最高のパフォーマンスを発揮する戦略と同等かそれ以上にパフォーマンスを発揮できることを示しています。

要約(オリジナル)

The hierarchy of global and local planners is one of the most commonly utilized system designs in autonomous robot navigation. While the global planner generates a reference path from the current to goal locations based on the pre-built map, the local planner produces a kinodynamic trajectory to follow the reference path while avoiding perceived obstacles. To account for unforeseen or dynamic obstacles not present on the pre-built map, “when to replan” the reference path is critical for the success of safe and efficient navigation. However, determining the ideal timing to execute replanning in such partially unknown environments still remains an open question. In this work, we first conduct an extensive simulation experiment to compare several common replanning strategies and confirm that effective strategies are highly dependent on the environment as well as the global and local planners. Based on this insight, we then derive a new adaptive replanning strategy based on deep reinforcement learning, which can learn from experience to decide appropriate replanning timings in the given environment and planning setups. Our experimental results show that the proposed replanner can perform on par or even better than the current best-performing strategies in multiple situations regarding navigation robustness and efficiency.

arxiv情報

著者 Kohei Honda,Ryo Yonetani,Mai Nishimura,Tadashi Kozuno
発行日 2024-02-27 01:24:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク