RUMOR: Reinforcement learning for Understanding a Model of the Real World for Navigation in Dynamic Environments

要約

動的環境での自律的なナビゲーションは、自律的なロボットにとって複雑ではあるが不可欠なタスクであり、最近の深い強化学習アプローチが有望な結果を示しています。
ただし、現実の世界の複雑さにより、あらゆるシナリオ構成でエージェントを訓練することは実行不可能です。
さらに、既存の方法は通常、ロボット速度動態制約などの要因を見落としたり、環境の完全な知識を想定したりします。
この作業では、非常にダイナミックな環境でナビゲートするために深い強化学習を使用する微分駆動ロボットの小説プランナーである噂を提示します。
他のエンドツーエンドDRLプランナーとは異なり、説明的なロボセントリック速度空間モデルを使用して動的な環境情報を抽出し、トレーニングの有効性とシナリオ解釈を強化します。
さらに、ロボットの動態を本質的に考慮し、現実世界の問題のある側面を再現するシミュレーターで訓練するアクション空間を提案し、現実とシミュレーションのギャップを減らします。
噂を他の最先端のアプローチと広範囲に比較し、より良いパフォーマンスを実証し、結果の詳細な分析を提供します。
最後に、地上ロボットに展開することにより、現実世界の設定での噂のパフォーマンスを検証します。
混雑したシナリオと目に見えない環境で実施された実験は、アルゴリズムの堅牢性と転送可能性を確認します。

要約(オリジナル)

Autonomous navigation in dynamic environments is a complex but essential task for autonomous robots, with recent deep reinforcement learning approaches showing promising results. However, the complexity of the real world makes it infeasible to train agents in every possible scenario configuration. Moreover, existing methods typically overlook factors such as robot kinodynamic constraints, or assume perfect knowledge of the environment. In this work, we present RUMOR, a novel planner for differential-drive robots that uses deep reinforcement learning to navigate in highly dynamic environments. Unlike other end-to-end DRL planners, it uses a descriptive robocentric velocity space model to extract the dynamic environment information, enhancing training effectiveness and scenario interpretation. Additionally, we propose an action space that inherently considers robot kinodynamics and train it in a simulator that reproduces the real world problematic aspects, reducing the gap between the reality and simulation. We extensively compare RUMOR with other state-of-the-art approaches, demonstrating a better performance, and provide a detailed analysis of the results. Finally, we validate RUMOR’s performance in real-world settings by deploying it on a ground robot. Our experiments, conducted in crowded scenarios and unseen environments, confirm the algorithm’s robustness and transferability.

arxiv情報

著者 Diego Martinez-Baselga,Luis Riazuelo,Luis Montano
発行日 2025-04-28 15:46:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク