Adaptive Social Force Window Planner with Reinforcement Learning

要約

人間を意識したナビゲーションは移動ロボットにとって複雑なタスクであり、社会に準拠した行動とともに効率的な経路計画を達成できる自律ナビゲーション システムが必要です。
ソーシャル プランナーは通常、目的関数にコストや制約を追加し、複雑な調整プロセスを行ったり、特定の社会シナリオに合わせてソリューションを調整したりすることになります。
機械学習はプランナーの汎用性を高め、データから複雑な社会的行動を学習するのに役立ちます。
この研究では、深層強化学習エージェントを使用して、軌道の評価に使用されるコスト関数の重み付けパラメーターを動的に調整する、適応型ソーシャル プランナーを提案しています。
結果として得られるプランナーは、ソーシャル フォース モデルに基づくソーシャル コストと統合された古典的なダイナミック ウィンドウ アプローチの堅牢性と、ソーシャル ナビゲーション タスクの全体的なパフォーマンスを向上させる学習方法の柔軟性を組み合わせています。
さまざまな環境での広範な実験により、静的なコスト プランナーに対する提案された方法の一般的な利点が実証されました。

要約(オリジナル)

Human-aware navigation is a complex task for mobile robots, requiring an autonomous navigation system capable of achieving efficient path planning together with socially compliant behaviors. Social planners usually add costs or constraints to the objective function, leading to intricate tuning processes or tailoring the solution to the specific social scenario. Machine Learning can enhance planners’ versatility and help them learn complex social behaviors from data. This work proposes an adaptive social planner, using a Deep Reinforcement Learning agent to dynamically adjust the weighting parameters of the cost function used to evaluate trajectories. The resulting planner combines the robustness of the classic Dynamic Window Approach, integrated with a social cost based on the Social Force Model, and the flexibility of learning methods to boost the overall performance on social navigation tasks. Our extensive experimentation on different environments demonstrates the general advantage of the proposed method over static cost planners.

arxiv情報

著者 Mauro Martini,Noé Pérez-Higueras,Andrea Ostuni,Marcello Chiaberge,Fernando Caballero,Luis Merino
発行日 2024-04-21 14:41:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク