Multi-modal Motion Prediction using Temporal Ensembling with Learning-based Aggregation

要約

近年、軌道予測のための学習ベースの方法への移行が見られますが、不確実性への対処とマルチモーダル分布の捕捉には課題が残っています。
この論文では、連続フレーム間で一貫性のない予測を引き起こす、軌道予測における欠落動作の問題を軽減するために設計されたメタ アルゴリズムである、学習ベースの集約による時間アンサンブルを紹介します。
従来のモデル アンサンブルとは異なり、時間アンサンブルでは近くのフレームからの予測を活用して、空間カバレッジと予測の多様性を強化します。
複数のフレームからの予測を確認することにより、時間アンサンブルは個々のフレーム予測で時折発生するエラーを補償します。
さらに、モデル アンサンブルでよく利用される軌跡レベルの集約は、交通状況の考慮が欠如しており、誤った運転行動を伴う候補軌跡を最終予測に割り当てる傾向があるため、時間アンサンブルには不十分です。
さらに、時間的アンサンブルに DETR のようなアーキテクチャ内でモード クエリを利用し、近くのフレームからの予測の特性を活用することで、学習ベースの集約の必要性を強調します。
Argoverse 2 データセットで検証された私たちの手法は、最も強力なベースラインである QCNet と比較して、minADE で 4% 減少、minFDE で 5% 減少、ミス率で 1.16% 減少という顕著な改善を示し、その有効性と可能性を強調しています。
自動運転において。

要約(オリジナル)

Recent years have seen a shift towards learning-based methods for trajectory prediction, with challenges remaining in addressing uncertainty and capturing multi-modal distributions. This paper introduces Temporal Ensembling with Learning-based Aggregation, a meta-algorithm designed to mitigate the issue of missing behaviors in trajectory prediction, which leads to inconsistent predictions across consecutive frames. Unlike conventional model ensembling, temporal ensembling leverages predictions from nearby frames to enhance spatial coverage and prediction diversity. By confirming predictions from multiple frames, temporal ensembling compensates for occasional errors in individual frame predictions. Furthermore, trajectory-level aggregation, often utilized in model ensembling, is insufficient for temporal ensembling due to a lack of consideration of traffic context and its tendency to assign candidate trajectories with incorrect driving behaviors to final predictions. We further emphasize the necessity of learning-based aggregation by utilizing mode queries within a DETR-like architecture for our temporal ensembling, leveraging the characteristics of predictions from nearby frames. Our method, validated on the Argoverse 2 dataset, shows notable improvements: a 4% reduction in minADE, a 5% decrease in minFDE, and a 1.16% reduction in the miss rate compared to the strongest baseline, QCNet, highlighting its efficacy and potential in autonomous driving.

arxiv情報

著者 Kai-Yin Hong,Chieh-Chih Wang,Wen-Chieh Lin
発行日 2024-10-25 14:59:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク