Safe and Generalized end-to-end Autonomous Driving System with Reinforcement Learning and Demonstrations

要約

インテリジェント運転システムは、システムの安全性と信頼性を確保しながら、現在の環境と車両の状態に基づいて適切な運転戦略を動的に策定できなければなりません。
しかし、強化学習と模倣学習に基づく既存の方法には、安全性が低く、一般化が不十分で、サンプリングが非効率であるという問題があります。
さらに、将来の運転軌跡を正確に予測することはできず、将来の運転軌跡を正確に予測することが最適な意思決定を行うための前提条件となります。
これらの問題を解決するために、このホワイトペーパーでは、複雑でさまざまなシナリオに対応する安全で汎用的なエンドツーエンド自動運転システム (SGADS) を紹介します。
当社の SGADS には、フローの正規化による変分推論が組み込まれており、インテリジェント車両が将来の走行軌跡を正確に予測できるようになります。
さらに、堅牢な安全制約の定式化を提案します。
さらに、強化学習とデモンストレーションを組み合わせて、エージェントの検索プロセスを強化します。
実験結果は、当社の SGADS が既存の方法と比較して、安全性能を大幅に向上させ、強力な一般化を示し、複雑な都市シナリオにおけるインテリジェント車両の訓練効率を高めることができることを示しています。

要約(オリジナル)

An intelligent driving system should be capable of dynamically formulating appropriate driving strategies based on the current environment and vehicle status, while ensuring the security and reliability of the system. However, existing methods based on reinforcement learning and imitation learning suffer from low safety, poor generalization, and inefficient sampling. Additionally, they cannot accurately predict future driving trajectories, and the accurate prediction of future driving trajectories is a precondition for making optimal decisions. To solve these problems, in this paper, we introduce a Safe and Generalized end-to-end Autonomous Driving System (SGADS) for complex and various scenarios. Our SGADS incorporates variational inference with normalizing flows, enabling the intelligent vehicle to accurately predict future driving trajectories. Moreover, we propose the formulation of robust safety constraints. Furthermore, we combine reinforcement learning with demonstrations to augment search process of the agent. The experimental results demonstrate that our SGADS can significantly improve safety performance, exhibit strong generalization, and enhance the training efficiency of intelligent vehicles in complex urban scenarios compared to existing methods.

arxiv情報

著者 Zuojin Tang,Xiaoyu Chen,YongQiang Li,Jianyu Chen
発行日 2024-01-22 09:44:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク