MeSA-DRL: Memory-Enhanced Deep Reinforcement Learning for Advanced Socially Aware Robot Navigation in Crowded Environments

要約

自律ナビゲーション機能は、人間との対話が極めて重要な環境で動作するサービス ロボットにおいて重要な役割を果たします。これらの環境は動的で予測不可能な性質を持っているためです。
しかし、人間の行動のばらつきは、特に混雑したシナリオにおいて、ロボットの動きの予測と予測において大きな課題となります。
この問題に対処するために、さまざまな歩行者シナリオにおける自律ロボットナビゲーションのために、メモリ対応の深層強化学習フレームワークが提案されています。
提案されたフレームワークは、長期記憶を活用して周囲に関する重要な情報を保持し、逐次依存関係を効果的にモデル化します。
人間とロボットのインタラクションの重要性もコード化されており、これらのインタラクションにより高い注目を集めています。
グローバル プランニング メカニズムがメモリ対応アーキテクチャに組み込まれています。
さらに、複数期間の報酬システムは、動的な警告ゾーンを組み込むことで、ロボットの長期的な行動を優先し、奨励するように設計されています。
同時に、滑らかな軌道を促進し、ロボットの目的の目標に到達するまでにかかる時間を最小限に抑えます。
広範なシミュレーション実験により、提案されたアプローチが代表的な最先端の方法より優れていることが示され、現実世界のシナリオにおけるナビゲーション効率と安全性に対するその能力が示されています。

要約(オリジナル)

Autonomous navigation capabilities play a critical role in service robots operating in environments where human interactions are pivotal, due to the dynamic and unpredictable nature of these environments. However, the variability in human behavior presents a substantial challenge for robots in predicting and anticipating movements, particularly in crowded scenarios. To address this issue, a memory-enabled deep reinforcement learning framework is proposed for autonomous robot navigation in diverse pedestrian scenarios. The proposed framework leverages long-term memory to retain essential information about the surroundings and model sequential dependencies effectively. The importance of human-robot interactions is also encoded to assign higher attention to these interactions. A global planning mechanism is incorporated into the memory-enabled architecture. Additionally, a multi-term reward system is designed to prioritize and encourage long-sighted robot behaviors by incorporating dynamic warning zones. Simultaneously, it promotes smooth trajectories and minimizes the time taken to reach the robot’s desired goal. Extensive simulation experiments show that the suggested approach outperforms representative state-of-the-art methods, showcasing its ability to a navigation efficiency and safety in real-world scenarios.

arxiv情報

著者 Mannan Saeed Muhammad,Estrella Montero
発行日 2024-04-08 05:10:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク