要約
予測の地平線が増加すると、エージェントの動きのマルチモーダルの性質により、トラフィックシーンの将来の進化を予測することがますます困難になります。
ほとんどの最先端(SOTA)予測モデルは、主に最も可能性の高い未来の予測に焦点を当てています。
ただし、自動運転車の安全な操作の場合、もっともらしい運動の代替品の分布をカバーすることも同様に重要です。
これに対処するために、可能なトラフィックシーンの進化の分布をキャプチャするために設計された新しいパラメーター効率の高い拡散ベースの生成モデルであるEp-Diffuserを紹介します。
道路のレイアウトとエージェントの履歴を条件に、私たちのモデルは予測因子として機能し、多様でもっともらしいシーンの継続を生成します。
Argoverse 2データセットでの予測の精度と妥当性の観点から、2つのSOTAモデルに対してEp-Diffuserをベンチマークします。
モデルサイズが大幅に小さくなりますが、私たちのアプローチは、非常に正確でもっともらしい交通シーンの予測の両方を達成します。
Waymo Open Datasetを使用して、分散排出(OOD)テスト設定でモデル一般化能力をさらに評価し、アプローチの優れた堅牢性を示します。
コードとモデルのチェックポイントは、https://github.com/continental/ep-diffuserにあります。
要約(オリジナル)
As the prediction horizon increases, predicting the future evolution of traffic scenes becomes increasingly difficult due to the multi-modal nature of agent motion. Most state-of-the-art (SotA) prediction models primarily focus on forecasting the most likely future. However, for the safe operation of autonomous vehicles, it is equally important to cover the distribution for plausible motion alternatives. To address this, we introduce EP-Diffuser, a novel parameter-efficient diffusion-based generative model designed to capture the distribution of possible traffic scene evolutions. Conditioned on road layout and agent history, our model acts as a predictor and generates diverse, plausible scene continuations. We benchmark EP-Diffuser against two SotA models in terms of accuracy and plausibility of predictions on the Argoverse 2 dataset. Despite its significantly smaller model size, our approach achieves both highly accurate and plausible traffic scene predictions. We further evaluate model generalization ability in an out-of-distribution (OoD) test setting using Waymo Open dataset and show superior robustness of our approach. The code and model checkpoints can be found here: https://github.com/continental/EP-Diffuser.
arxiv情報
著者 | Yue Yao,Mohamed-Khalil Bouzidi,Daniel Goehring,Joerg Reichardt |
発行日 | 2025-04-07 18:45:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google