要約
インテリジェントな運転システムは、システムのセキュリティと信頼性を確保しながら、現在の環境と車両のステータスに基づいて適切な運転戦略を動的に策定する必要があります。
ただし、補強学習と模倣学習に基づく方法は、多くの場合、サンプルの複雑さ、一般化が不十分で、安全性が低くなります。
これらの課題に対処するために、このペーパーでは、複雑で多様なシナリオのための効率的で一般化されたエンドツーエンドの自律駆動システム(EGAD)を紹介します。
EGADSのRLエージェントは、分布の仮定とは無関係の変分推論と正規化フローを組み合わせています。
この組み合わせにより、エージェントは潜在スペースを効果的に運転することに関連する履歴情報をキャプチャでき、それによりサンプルの複雑さが大幅に削減されます。
さらに、堅牢な安全性の制約を策定することにより、RLと専門家のデモを統合することにより、一般化とパフォーマンスを改善することにより、安全性を高めます。
実験結果は、既存の方法と比較して、EGADがサンプルの複雑さを大幅に減らし、安全性能を大幅に改善し、複雑な都市シナリオで強力な一般化能力を示すことを示しています。
特に、特にG29ステアリングホイールを使用して、人間のエキスパートステアリングホイールコントロールを通じて収集されたエキスパートデータセットを提供しました。
要約(オリジナル)
An intelligent driving system should dynamically formulate appropriate driving strategies based on the current environment and vehicle status while ensuring system security and reliability. However, methods based on reinforcement learning and imitation learning often suffer from high sample complexity, poor generalization, and low safety. To address these challenges, this paper introduces an efficient and generalized end-to-end autonomous driving system (EGADS) for complex and varied scenarios. The RL agent in our EGADS combines variational inference with normalizing flows, which are independent of distribution assumptions. This combination allows the agent to capture historical information relevant to driving in latent space effectively, thereby significantly reducing sample complexity. Additionally, we enhance safety by formulating robust safety constraints and improve generalization and performance by integrating RL with expert demonstrations. Experimental results demonstrate that, compared to existing methods, EGADS significantly reduces sample complexity, greatly improves safety performance, and exhibits strong generalization capabilities in complex urban scenarios. Particularly, we contributed an expert dataset collected through human expert steering wheel control, specifically using the G29 steering wheel.
arxiv情報
著者 | Zuojin Tang,Xiaoyu Chen,Yongqiang Li,Jianyu Chen |
発行日 | 2025-06-09 15:02:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google