Learning Occlusion-aware Decision-making from Agent Interaction via Active Perception

要約

さまざまなオクルージョンの不確実性が高いため、自動運転ではオクルージョンを意識した意思決定が不可欠です。
最近のオクルージョンを意識した意思決定方法では、計算の複雑さ、シナリオのスケーラビリティの課題、限られた専門家データへの依存などの問題に直面しています。
探索ランダム化によるデータの自動生成の恩恵を受けて、強化学習 (RL) がオクルージョンを意識した意思決定に有望である可能性があることを発見しました。
ただし、以前のオクルージョン認識 RL は、さまざまな動的および静的なオクルージョン シナリオへの拡張、学習効率の低さ、予測能力の欠如という課題に直面しています。
これらの問題に対処するために、能動的な知覚を通じてオクルージョンを意識した意思決定を学習する自己強化フレームワークである Pad-AI を導入します。
Pad-AI は、ベクトル化された表現を利用して遮蔽された環境を効率的に表現し、セマンティック モーション プリミティブを学習して高レベルのアクティブな知覚探索に焦点を当てます。
さらに、Pad-AI は予測と RL を統合フレームワーク内に統合し、リスクを意識した学習とセキュリティ保証を提供します。
私たちのフレームワークは、動的オクルージョンと静的オクルージョンの両方の下で困難なシナリオでテストされ、閉ループ評価における他の強力なベースラインに対する効率的で一般的な知覚を意識した探索パフォーマンスを実証しました。

要約(オリジナル)

Occlusion-aware decision-making is essential in autonomous driving due to the high uncertainty of various occlusions. Recent occlusion-aware decision-making methods encounter issues such as high computational complexity, scenario scalability challenges, or reliance on limited expert data. Benefiting from automatically generating data by exploration randomization, we uncover that reinforcement learning (RL) may show promise in occlusion-aware decision-making. However, previous occlusion-aware RL faces challenges in expanding to various dynamic and static occlusion scenarios, low learning efficiency, and lack of predictive ability. To address these issues, we introduce Pad-AI, a self-reinforcing framework to learn occlusion-aware decision-making through active perception. Pad-AI utilizes vectorized representation to represent occluded environments efficiently and learns over the semantic motion primitives to focus on high-level active perception exploration. Furthermore, Pad-AI integrates prediction and RL within a unified framework to provide risk-aware learning and security guarantees. Our framework was tested in challenging scenarios under both dynamic and static occlusions and demonstrated efficient and general perception-aware exploration performance to other strong baselines in closed-loop evaluations.

arxiv情報

著者 Jie Jia,Yiming Shu,Zhongxue Gan,Wenchao Ding
発行日 2024-09-26 08:10:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク