Efficient and Generalized end-to-end Autonomous Driving System with Latent Deep Reinforcement Learning and Demonstrations

要約

インテリジェント運転システムは、システムのセキュリティと信頼性を確保しながら、現在の環境と車両の状態に基づいて適切な運転戦略を動的に策定する必要があります。
ただし、強化学習と模倣学習に基づく方法は、多くの場合、サンプルの複雑さの高さ、汎化の不十分さ、安全性の低さという問題があります。
これらの課題に対処するために、このホワイトペーパーでは、複雑で多様なシナリオ向けの効率的で汎用的なエンドツーエンド自動運転システム (EGADS) を紹介します。
EGADS の RL エージェントは、変分推論と正規化フローを組み合わせたもので、分布の仮定には依存しません。
この組み合わせにより、エージェントは潜在空間での運転に関連する履歴情報を効果的に取得できるため、サンプルの複雑さが大幅に軽減されます。
さらに、堅牢な安全制約を定式化することで安全性を強化し、RL と専門家のデモンストレーションを統合することで一般化とパフォーマンスを向上させます。
実験結果は、既存の方法と比較して、EGADS がサンプルの複雑さを大幅に軽減し、安全性能を大幅に向上させ、複雑な都市シナリオにおいて強力な一般化機能を発揮することを示しています。
特に、私たちは、特に G29 ステアリング ホイールを使用した、人間の専門家によるステアリング ホイール制御を通じて収集された専門家データセットに貢献しました。

要約(オリジナル)

An intelligent driving system should dynamically formulate appropriate driving strategies based on the current environment and vehicle status while ensuring system security and reliability. However, methods based on reinforcement learning and imitation learning often suffer from high sample complexity, poor generalization, and low safety. To address these challenges, this paper introduces an Efficient and Generalized end-to-end Autonomous Driving System (EGADS) for complex and varied scenarios. The RL agent in our EGADS combines variational inference with normalizing flows, which are independent of distribution assumptions. This combination allows the agent to capture historical information relevant to driving in latent space effectively, thereby significantly reducing sample complexity. Additionally, we enhance safety by formulating robust safety constraints and improve generalization and performance by integrating RL with expert demonstrations. Experimental results demonstrate that, compared to existing methods, EGADS significantly reduces sample complexity, greatly improves safety performance, and exhibits strong generalization capabilities in complex urban scenarios. Particularly, we contributed an expert dataset collected through human expert steering wheel control, specifically using the G29 steering wheel.

arxiv情報

著者 Zuojin Tang,Xiaoyu Chen,YongQiang Li,Jianyu Chen
発行日 2024-06-16 12:48:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク