Annealed Winner-Takes-All for Motion Forecasting

要約

自動運転における動作予測は、近くのエージェントの将来の軌道を予測することを目的としており、自車両が行動を予測して安全に運転できるように支援します。
主な課題は、多様な将来予測を生成することであり、一般的に多肢選択学習 (MCL) アーキテクチャと Winner-Takes-All (WTA) トレーニング目標を備えたデータ駆動型モデルを使用して対処されます。
ただし、これらの方法は、初期化の感度とトレーニングの不安定性に直面します。
さらに、限られたパフォーマンスを補うために、一部のアプローチは大規模な仮説セットを使用したトレーニングに依存しており、予測の数を大幅に減らすために推論中に選択後のステップが必要になります。
これらの問題に取り組むために、私たちはアニールされた MCL からインスピレーションを得ています。これは、アニールされた Winner-Takes-All 損失 (aWTA) を通じて MCL 法の収束特性を改善する最近導入された手法です。
この論文では、aWTA 損失を最先端の動き予測モデルと統合して、最小限の仮説セットのみを使用してパフォーマンスを向上させ、面倒な選択後のステップの必要性を排除する方法を示します。
私たちのアプローチは、通常 WTA を使用してトレーニングされるあらゆる軌道予測モデルに簡単に組み込むことができ、大幅な改善をもたらします。
将来の動き予測モデルへの私たちのアプローチの適用を容易にするために、コードは承認され次第公開されます: https://github.com/valeoai/MF_aWTA。

要約(オリジナル)

In autonomous driving, motion prediction aims at forecasting the future trajectories of nearby agents, helping the ego vehicle to anticipate behaviors and drive safely. A key challenge is generating a diverse set of future predictions, commonly addressed using data-driven models with Multiple Choice Learning (MCL) architectures and Winner-Takes-All (WTA) training objectives. However, these methods face initialization sensitivity and training instabilities. Additionally, to compensate for limited performance, some approaches rely on training with a large set of hypotheses, requiring a post-selection step during inference to significantly reduce the number of predictions. To tackle these issues, we take inspiration from annealed MCL, a recently introduced technique that improves the convergence properties of MCL methods through an annealed Winner-Takes-All loss (aWTA). In this paper, we demonstrate how the aWTA loss can be integrated with state-of-the-art motion forecasting models to enhance their performance using only a minimal set of hypotheses, eliminating the need for the cumbersome post-selection step. Our approach can be easily incorporated into any trajectory prediction model normally trained using WTA and yields significant improvements. To facilitate the application of our approach to future motion forecasting models, the code will be made publicly available upon acceptance: https://github.com/valeoai/MF_aWTA.

arxiv情報

著者 Yihong Xu,Victor Letzelter,Mickaël Chen,Éloi Zablocki,Matthieu Cord
発行日 2024-09-18 09:35:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク