Learning Occlusion-aware Decision-making from Agent Interaction via Active Perception

要約

咬合を意識する意思決定は、さまざまな閉塞の不確実性が高いため、自律運転に不可欠です。
最近の閉塞を意識した意思決定方法は、高い計算の複雑さ、シナリオのスケーラビリティの課題、限られた専門家データへの依存などの問題に遭遇します。
探査のランダム化による自動的にデータを生成することで恩恵を受けて、補強学習(RL)が閉塞を意識した意思決定において有望であることを明らかにします。
ただし、以前のオクルージョンを意識したRLは、さまざまな動的および静的閉塞シナリオ、低学習効率、予測能力の欠如に拡大する際の課題に直面しています。
これらの問題に対処するために、積極的な知覚を通じて閉塞を意識した意思決定を学ぶために、自己強化フレームワークであるPad-AIを紹介します。
PAD-AIは、ベクトル化された表現を利用して閉塞した環境を効率的に表現し、セマンティックモーションプリミティブで学習し、高レベルのアクティブな知覚探査に焦点を当てます。
さらに、PAD-AIは、統一されたフレームワーク内に予測とRLを統合して、リスク認識の学習とセキュリティ保証を提供します。
私たちのフレームワークは、動的閉塞と静的な閉塞の両方の下で挑戦的なシナリオでテストされ、閉ループ評価の他の強力なベースラインに対して効率的で一般的な知覚を意識した探索パフォーマンスを実証しました。

要約(オリジナル)

Occlusion-aware decision-making is essential in autonomous driving due to the high uncertainty of various occlusions. Recent occlusion-aware decision-making methods encounter issues such as high computational complexity, scenario scalability challenges, or reliance on limited expert data. Benefiting from automatically generating data by exploration randomization, we uncover that reinforcement learning (RL) may show promise in occlusion-aware decision-making. However, previous occlusion-aware RL faces challenges in expanding to various dynamic and static occlusion scenarios, low learning efficiency, and lack of predictive ability. To address these issues, we introduce Pad-AI, a self-reinforcing framework to learn occlusion-aware decision-making through active perception. Pad-AI utilizes vectorized representation to represent occluded environments efficiently and learns over the semantic motion primitives to focus on high-level active perception exploration. Furthermore, Pad-AI integrates prediction and RL within a unified framework to provide risk-aware learning and security guarantees. Our framework was tested in challenging scenarios under both dynamic and static occlusions and demonstrated efficient and general perception-aware exploration performance to other strong baselines in closed-loop evaluations.

arxiv情報

著者 Jie Jia,Yiming Shu,Zhongxue Gan,Wenchao Ding
発行日 2025-04-09 10:34:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク