Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay

要約

この論文では、自動運転車が複数車線の高速道路上の車両の流れにシームレスに統合する必要がある、自動運転ランプ合流という困難な問題に対処するための新しいアプローチを紹介します。
潜在状態推論および安全性コントローラー (L3IS) を使用した車線維持、車線変更エージェントを紹介します。これは、周囲の車両の意図や運転スタイルに関する包括的な知識がなくても、ランプ上の合流タスクを安全に実行するように設計されています。
また、観測遅延を考慮した AL3IS と呼ばれるこのエージェントの拡張機能も提供します。これにより、エージェントは車車間 (V2V) 通信遅延のある現実世界の環境でより堅牢な意思決定を行うことができます。
他のドライバーの意図など、潜在的な状態を通じて環境の観察できない側面をモデル化することで、私たちのアプローチは、動的な交通状況に適応し、合流操作を最適化し、他の車両との安全な相互作用を確保するエージェントの能力を強化します。
実際の交通データから生成された広範なシミュレーションを通じてこの方法の有効性を実証し、そのパフォーマンスを既存のアプローチと比較します。
L3IS は、実際の米国高速道路 101 号線のデータから生成された、困難なランプでの合流ケースにおいて 99.90% の成功率を示しています。
さらに、AL3IS の感度分析を実行して、さまざまな観測遅延に対する堅牢性を評価しました。これにより、1 秒の V2V 通信遅延で 93.84% の成功率という許容可能なパフォーマンスが実証されました。

要約(オリジナル)

This paper presents a novel approach to address the challenging problem of autonomous on-ramp merging, where a self-driving vehicle needs to seamlessly integrate into a flow of vehicles on a multi-lane highway. We introduce the Lane-keeping, Lane-changing with Latent-state Inference and Safety Controller (L3IS) agent, designed to perform the on-ramp merging task safely without comprehensive knowledge about surrounding vehicles’ intents or driving styles. We also present an augmentation of this agent called AL3IS that accounts for observation delays, allowing the agent to make more robust decisions in real-world environments with vehicle-to-vehicle (V2V) communication delays. By modeling the unobservable aspects of the environment through latent states, such as other drivers’ intents, our approach enhances the agent’s ability to adapt to dynamic traffic conditions, optimize merging maneuvers, and ensure safe interactions with other vehicles. We demonstrate the effectiveness of our method through extensive simulations generated from real traffic data and compare its performance with existing approaches. L3IS shows a 99.90% success rate in a challenging on-ramp merging case generated from the real US Highway 101 data. We further perform a sensitivity analysis on AL3IS to evaluate its robustness against varying observation delays, which demonstrates an acceptable performance of 93.84% success rate in 1-second V2V communication delay.

arxiv情報

著者 Amin Tabrizian,Zhitong Huang,Peng Wei
発行日 2024-06-21 15:31:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク