Minds on the Move: Decoding Trajectory Prediction in Autonomous Driving with Cognitive Insights

要約

混合自律運転環境では、周囲の車両の将来の軌跡を正確に予測することは、自律車両(AVS)の安全な操作に不可欠です。
運転シナリオでは、車両の軌跡は、人間のドライバーの意思決定プロセスによって決定されます。
ただし、既存のモデルは主にデータの固有の統計パターンに焦点を当てており、多くの場合、人間のドライバーの意思決定プロセスを理解する重要な側面を無視します。
この監視の結果、人間のドライバーの真の意図を把握できないモデルが生じ、長期的な軌跡予測で最適ではないパフォーマンスにつながります。
この制限に対処するために、ドライバーの意思決定メカニズムを解釈するために、認知概念、知覚された安全性を組み込んだ認知情報に基づいたトランス(CITF)を導入します。
知覚された安全性は、異なる運転行動を持つドライバー全体のさまざまなリスク許容度をカプセル化します。
具体的には、シナリオ内で被験者のリスクレベルを測定するための定量的な安全性評価と、ドライバーの行動を特徴付けるドライバーの動作プロファイリングを含む、知覚される安全性認識モジュールを開発します。
さらに、車両間の社会的相互作用をキャプチャするように設計された新しいモジュールであるLeanformerを提示します。
CITFは、3つの確立されたデータセットで大幅なパフォーマンスの改善を示しています。
長期予測の観点から、NGSIMで既存のベンチマークを12.0%、HighDで28.2%、MoCADデータセットで20.8%を上回ります。
さらに、データが限られているか欠落しているシナリオでの堅牢性は明らかであり、最も最先端の(SOTA)ベースラインを上回り、実際のアプリケーションの道を開いています。

要約(オリジナル)

In mixed autonomous driving environments, accurately predicting the future trajectories of surrounding vehicles is crucial for the safe operation of autonomous vehicles (AVs). In driving scenarios, a vehicle’s trajectory is determined by the decision-making process of human drivers. However, existing models primarily focus on the inherent statistical patterns in the data, often neglecting the critical aspect of understanding the decision-making processes of human drivers. This oversight results in models that fail to capture the true intentions of human drivers, leading to suboptimal performance in long-term trajectory prediction. To address this limitation, we introduce a Cognitive-Informed Transformer (CITF) that incorporates a cognitive concept, Perceived Safety, to interpret drivers’ decision-making mechanisms. Perceived Safety encapsulates the varying risk tolerances across drivers with different driving behaviors. Specifically, we develop a Perceived Safety-aware Module that includes a Quantitative Safety Assessment for measuring the subject risk levels within scenarios, and Driver Behavior Profiling for characterizing driver behaviors. Furthermore, we present a novel module, Leanformer, designed to capture social interactions among vehicles. CITF demonstrates significant performance improvements on three well-established datasets. In terms of long-term prediction, it surpasses existing benchmarks by 12.0% on the NGSIM, 28.2% on the HighD, and 20.8% on the MoCAD dataset. Additionally, its robustness in scenarios with limited or missing data is evident, surpassing most state-of-the-art (SOTA) baselines, and paving the way for real-world applications.

arxiv情報

著者 Haicheng Liao,Chengyue Wang,Kaiqun Zhu,Yilong Ren,Bolin Gao,Shengbo Eben Li,Chengzhong Xu,Zhenning Li
発行日 2025-02-27 13:43:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク