要約
インタラクティブな意思決定は、自律運転などのアプリケーションでは不可欠です。このアプリケーションでは、エージェントがリアルタイムで計画しながら近くの人間のドライバーの行動を推測する必要があります。
人間の行動の正確な推論には、分離された予測ではなく継続的な相互作用が必要であるため、従来の予測からのフレームワークはしばしば不十分または非効率的です。
これに対処するために、予測された信念分布を厳密に導き出す積極的な学習フレームワークを提案します。
さらに、複雑で非凸の高速道路の合併シナリオを通じて実証された、オンラインの後退地平線制御の問題に合わせた新しいモデルベースの拡散ソルバーを紹介します。
私たちのアプローチは、以前の高忠実度のデュアルコントロールシミュレーションをハードウェア実験に拡張します。これは、https://youtu.be/q_jdzuopgl4で表示され、人間駆動型のトラフィックシナリオの動作推論を検証し、理想化されたモデルを超えて移動します。
結果は、不確実性の下での適応計画の改善を示しており、実際のアプリケーションのインタラクティブな意思決定の分野を進めています。
要約(オリジナル)
Interactive decision-making is essential in applications such as autonomous driving, where the agent must infer the behavior of nearby human drivers while planning in real-time. Traditional predict-then-act frameworks are often insufficient or inefficient because accurate inference of human behavior requires a continuous interaction rather than isolated prediction. To address this, we propose an active learning framework in which we rigorously derive predicted belief distributions. Additionally, we introduce a novel model-based diffusion solver tailored for online receding horizon control problems, demonstrated through a complex, non-convex highway merging scenario. Our approach extends previous high-fidelity dual control simulations to hardware experiments, which may be viewed at https://youtu.be/Q_JdZuopGL4, and verifies behavior inference in human-driven traffic scenarios, moving beyond idealized models. The results show improvements in adaptive planning under uncertainty, advancing the field of interactive decision-making for real-world applications.
arxiv情報
著者 | Jacob Knaup,Jovin D’sa,Behdad Chalaki,Hossein Nourkhiz Mahjoub,Ehsan Moradi-Pari,Panagiotis Tsiotras |
発行日 | 2025-02-14 05:06:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google