Decision Making for Autonomous Driving in Interactive Merge Scenarios via Learning-based Prediction

要約

人間のドライバーと共有する道路を走行する自律型エージェントは、交通参加者間の微妙な相互作用について推論する必要があります。
人間の行動は、モデル化が困難な多数の要因 (人間の意図や感情など) の影響を受けるため、これは非常に困難な意思決定の問題を引き起こします。
このホワイトペーパーでは、他のドライバーの行動や不完全なセンサー測定から不確実性が生じる移動交通への合流という複雑なタスクに焦点を当てた、自動運転の意思決定アプローチについて説明します。
問題を部分的に観測可能なマルコフ決定過程 (POMDP) として組み立て、モンテカルロ木探索を使用してオンラインで解決します。
POMDP の解決策は、接近する車に道を譲る、前の車との安全な車間距離を保つ、交通に合流するなど、高レベルの運転操作を実行するポリシーです。
私たちの方法は、データから学習したモデルを活用して、周囲のエージェント間の相互作用を明示的に考慮しながら、トラフィックの将来の状態を予測します。
これらの予測から、自動運転車はその行動が環境に与える将来の結果を予測し、それに応じて軌道を最適化できます。
シミュレーションでアプローチを徹底的にテストし、自律走行車がさまざまな状況にその動作を適応できることを示します。
また、他の方法と比較して、考慮されたパフォーマンス メトリックに関して改善を示します。

要約(オリジナル)

Autonomous agents that drive on roads shared with human drivers must reason about the nuanced interactions among traffic participants. This poses a highly challenging decision making problem since human behavior is influenced by a multitude of factors (e.g., human intentions and emotions) that are hard to model. This paper presents a decision making approach for autonomous driving, focusing on the complex task of merging into moving traffic where uncertainty emanates from the behavior of other drivers and imperfect sensor measurements. We frame the problem as a partially observable Markov decision process (POMDP) and solve it online with Monte Carlo tree search. The solution to the POMDP is a policy that performs high-level driving maneuvers, such as giving way to an approaching car, keeping a safe distance from the vehicle in front or merging into traffic. Our method leverages a model learned from data to predict the future states of traffic while explicitly accounting for interactions among the surrounding agents. From these predictions, the autonomous vehicle can anticipate the future consequences of its actions on the environment and optimize its trajectory accordingly. We thoroughly test our approach in simulation, showing that the autonomous vehicle can adapt its behavior to different situations. We also compare against other methods, demonstrating an improvement with respect to the considered performance metrics.

arxiv情報

著者 Salar Arbabi,Davide Tavernini,Saber Fallah,Richard Bowden
発行日 2023-03-29 16:12:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク