Human-Like Implicit Intention Expression for Autonomous Driving Motion Planning: A Method Based on Learning Human Intention Priors

要約

自動運転車 (AV) が既存の交通システムにシームレスに統合できるかどうかを決定する重要な要素の 1 つは、人間のドライバーとスムーズかつ効率的に対話し、ドライバーの意図を伝える能力です。
多くの研究は、行動意思決定レベルでの AV の人間のようなインタラクションとコミュニケーション能力の強化に焦点を当ててきましたが、AV の実際の動作軌跡と人間のドライバーの心理的期待の間には大きなギャップが残っています。
この不一致は、AV-HV (自律車両-人間車両) の相互作用の安全性と効率に重大な影響を与える可能性があります。
これらの課題に対処するために、我々は暗黙的な意図表現を組み込んだAVの動作計画手法を提案します。
まず、人間の暗黙的な意図の事前分布に基づいて軌道空間制約を構築し、軌道空間を圧縮および枝刈りして、意図の表現を考慮した候補動作軌道を生成します。
次に、最大エントロピー逆強化学習を適用して人間の軌道の好みを学習および推定し、ドライバーの認知特性を表す報酬関数を構築します。
最後に、ボルツマン分布を使用して、得られた報酬に基づいて候補となる軌道の確率分布を確立し、人間のような軌道アクションを選択します。
実際の軌道データセットでアプローチを検証し、それをいくつかのベースライン手法と比較しました。
その結果、我々の手法は人間らしさ、意図表現能力、計算効率の点で優れていることが分かりました。

要約(オリジナル)

One of the key factors determining whether autonomous vehicles (AVs) can be seamlessly integrated into existing traffic systems is their ability to interact smoothly and efficiently with human drivers and communicate their intentions. While many studies have focused on enhancing AVs’ human-like interaction and communication capabilities at the behavioral decision-making level, a significant gap remains between the actual motion trajectories of AVs and the psychological expectations of human drivers. This discrepancy can seriously affect the safety and efficiency of AV-HV (Autonomous Vehicle-Human Vehicle) interactions. To address these challenges, we propose a motion planning method for AVs that incorporates implicit intention expression. First, we construct a trajectory space constraint based on human implicit intention priors, compressing and pruning the trajectory space to generate candidate motion trajectories that consider intention expression. We then apply maximum entropy inverse reinforcement learning to learn and estimate human trajectory preferences, constructing a reward function that represents the cognitive characteristics of drivers. Finally, using a Boltzmann distribution, we establish a probabilistic distribution of candidate trajectories based on the reward obtained, selecting human-like trajectory actions. We validated our approach on a real trajectory dataset and compared it with several baseline methods. The results demonstrate that our method excels in human-likeness, intention expression capability, and computational efficiency.

arxiv情報

著者 Jiaqi Liu,Xiao Qi,Ying Ni,Jian Sun,Peng Hang
発行日 2024-09-04 00:05:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク