Collision Probability Distribution Estimation via Temporal Difference Learning

要約

CollisionPro は、時間差分学習を使用して累積衝突確率分布を推定するように設計された先駆的なフレームワークであり、特に自動運転に重点を置いたロボット工学のアプリケーションに特化しています。
このアプローチは、説明可能な人工知能 (XAI) の需要に対応し、モデルベースのアプローチと保守的な制約によって課せられる制限を克服しようとします。
私たちは強化学習のコンテキスト内でフレームワークを策定し、安全性を意識したエージェントへの道を切り開きます。
それにもかかわらず、私たちは、安全警報システムや分析目的など、さまざまな状況において私たちのアプローチが有益であることが証明される可能性があると主張します。
私たちのフレームワークの包括的な検査は、現実的な自動運転シミュレーターを使用して行われ、その高いサンプル効率と、これまでに見たことのない衝突イベントに対する信頼性の高い予測機能が実証されています。
ソースコードは公開されています。

要約(オリジナル)

We introduce CollisionPro, a pioneering framework designed to estimate cumulative collision probability distributions using temporal difference learning, specifically tailored to applications in robotics, with a particular emphasis on autonomous driving. This approach addresses the demand for explainable artificial intelligence (XAI) and seeks to overcome limitations imposed by model-based approaches and conservative constraints. We formulate our framework within the context of reinforcement learning to pave the way for safety-aware agents. Nevertheless, we assert that our approach could prove beneficial in various contexts, including a safety alert system or analytical purposes. A comprehensive examination of our framework is conducted using a realistic autonomous driving simulator, illustrating its high sample efficiency and reliable prediction capabilities for previously unseen collision events. The source code is publicly available.

arxiv情報

著者 Thomas Steinecker,Thorsten Luettel,Mirko Maehlisch
発行日 2024-07-29 13:32:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク