Collision-Free Robot Navigation in Crowded Environments using Learning based Convex Model Predictive Control

要約

混雑した複雑な環境でロボットを安全かつ効率的に移動させることは、依然として大きな課題です。
ただし、これらの設定は動的で複雑な性質を持っているため、ロボットが追跡するための効率的で衝突のない経路を計画することは特に困難です。
この論文では、2D LiDAR データから計算された凸状の障害物のない領域を利用して、ロボットの知覚、意思決定、制御プロセスを独自に橋渡しします。
全体的なパイプラインは 3 つあります。 (1) 深層強化学習 (DRL) を利用するロボット ナビゲーション フレームワークを提案し、観測を凸状の障害物のない領域として概念化し、生のセンサー入力への一般的な依存から脱却します。
(2) 本質的に衝突のない基準点の効率的なサンプリングを可能にするために、ロボットの運動学的限界と凸領域の交点から導出されるアクション空間を設計します。
これらのアクションは、ロボットが目標に向かって移動し、ナビゲーション中に他の障害物と相互作用するようにガイドするのに役立ちます。
(3) モデル予測制御 (MPC) を使用して、凸状の障害物のない領域とロボットの運動力学的限界によって課される制約を満たしながら、基準点によって形成される軌道を追跡します。
提案された改善の有効性は、2 セットのアブレーション研究とタイムド エラスティック バンド (TEB) との比較実験を通じて検証され、混雑した複雑な環境におけるナビゲーション パフォーマンスの向上が実証されました。

要約(オリジナル)

Navigating robots safely and efficiently in crowded and complex environments remains a significant challenge. However, due to the dynamic and intricate nature of these settings, planning efficient and collision-free paths for robots to track is particularly difficult. In this paper, we uniquely bridge the robot’s perception, decision-making and control processes by utilizing the convex obstacle-free region computed from 2D LiDAR data. The overall pipeline is threefold: (1) We proposes a robot navigation framework that utilizes deep reinforcement learning (DRL), conceptualizing the observation as the convex obstacle-free region, a departure from general reliance on raw sensor inputs. (2) We design the action space, derived from the intersection of the robot’s kinematic limits and the convex region, to enable efficient sampling of inherently collision-free reference points. These actions assists in guiding the robot to move towards the goal and interact with other obstacles during navigation. (3) We employ model predictive control (MPC) to track the trajectory formed by the reference points while satisfying constraints imposed by the convex obstacle-free region and the robot’s kinodynamic limits. The effectiveness of proposed improvements has been validated through two sets of ablation studies and a comparative experiment against the Timed Elastic Band (TEB), demonstrating improved navigation performance in crowded and complex environments.

arxiv情報

著者 Zhuanglei Wen,Mingze Dong,Xiai Chen
発行日 2024-03-14 13:54:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク