要約
歩行者が多い環境での低速自動運転車 (AV) の安全で社会に準拠した効率的なナビゲーションには、歩行者の将来の位置と車両やその他の車両との相互作用を考慮する必要があります。
観察されていない状態(意図など)による歩行者の予測軌跡に関連する避けられない不確実性にもかかわらず、群集ナビゲーション用の既存の深層強化学習(DRL)アルゴリズムは、予測軌跡をポリシー学習のガイドに使用する際にこれらの不確実性を無視することがよくあります。
この省略により、グラウンド トゥルースから逸脱する場合の予測の有用性が制限されます。
この研究では、モデルフリーの DRL アルゴリズムのトレーニングに予測される歩行者の状態の不確実性を組み込む、統合された予測および計画のアプローチを導入します。
新しい報酬関数により、AV は歩行者のパーソナル スペースを尊重し、接近中の速度を下げ、予測された経路との衝突確率を最小限に抑えることができます。
以前の DRL 手法とは異なり、混雑した空間での AV 操作用に設計された私たちのモデルは、車両との共有空間での現実的な歩行者の行動を反映する新しいシミュレーション環境でトレーニングされます。
結果は、予測の不確実性を考慮していない最先端のモデルと比較して、衝突率が 40% 減少し、歩行者までの最小距離が 15% 増加したことを示しています。
さらに、このアプローチは、パフォーマンスと計算時間の両方の点で、同じ予測不確実性を組み込んだモデル予測制御手法よりも優れており、同様のシナリオで人間のドライバーにより近い軌道を生成します。
要約(オリジナル)
Safe, socially compliant, and efficient navigation of low-speed autonomous vehicles (AVs) in pedestrian-rich environments necessitates considering pedestrians’ future positions and interactions with the vehicle and others. Despite the inevitable uncertainties associated with pedestrians’ predicted trajectories due to their unobserved states (e.g., intent), existing deep reinforcement learning (DRL) algorithms for crowd navigation often neglect these uncertainties when using predicted trajectories to guide policy learning. This omission limits the usability of predictions when diverging from ground truth. This work introduces an integrated prediction and planning approach that incorporates the uncertainties of predicted pedestrian states in the training of a model-free DRL algorithm. A novel reward function encourages the AV to respect pedestrians’ personal space, decrease speed during close approaches, and minimize the collision probability with their predicted paths. Unlike previous DRL methods, our model, designed for AV operation in crowded spaces, is trained in a novel simulation environment that reflects realistic pedestrian behaviour in a shared space with vehicles. Results show a 40% decrease in collision rate and a 15% increase in minimum distance to pedestrians compared to the state of the art model that does not account for prediction uncertainty. Additionally, the approach outperforms model predictive control methods that incorporate the same prediction uncertainties in terms of both performance and computational time, while producing trajectories closer to human drivers in similar scenarios.
arxiv情報
著者 | Mahsa Golchoubian,Moojan Ghafurian,Kerstin Dautenhahn,Nasser Lashgarian Azad |
発行日 | 2024-05-22 20:09:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google