Conditional Unscented Autoencoders for Trajectory Prediction


CVAE は、AD の軌道予測で最も広く使用されているモデルの 1 つです。
このペーパーでは、CVAE の主要なコンポーネントに挑戦します。
私たちは、CVAE の基礎である VAE の分野における最近の進歩を活用しており、サンプリング手順の単純な変更がパフォーマンスに大きな利益をもたらす可能性があることを示しています。
私たちは、学習した分布から決定論的な方法でサンプルを抽出するアンセンテッド サンプリングの方が、潜在的に危険なランダム サンプリングよりも当然ながら軌道予測に適していることがわかりました。
私たちはさらに進んで、より構造化されたガウス混合潜在空間や、CVAE を使用して推論を行うための新しい潜在的により表現力豊かな方法など、追加の改善を提供します。
私たちは、INTERACTION 予測データセットでモデルを評価することでモデルの幅広い適用性を示し、最先端のパフォーマンスを上回りました。また、CelebA データセットでの画像モデリングのタスクでも、ベースラインのバニラ CVAE を上回りました。
コードは で入手できます。


The CVAE is one of the most widely-used models in trajectory prediction for AD. It captures the interplay between a driving context and its ground-truth future into a probabilistic latent space and uses it to produce predictions. In this paper, we challenge key components of the CVAE. We leverage recent advances in the space of the VAE, the foundation of the CVAE, which show that a simple change in the sampling procedure can greatly benefit performance. We find that unscented sampling, which draws samples from any learned distribution in a deterministic manner, can naturally be better suited to trajectory prediction than potentially dangerous random sampling. We go further and offer additional improvements including a more structured Gaussian mixture latent space, as well as a novel, potentially more expressive way to do inference with CVAEs. We show wide applicability of our models by evaluating them on the INTERACTION prediction dataset, outperforming the state of the art, as well as at the task of image modeling on the CelebA dataset, outperforming the baseline vanilla CVAE. Code is available at


著者 Faris Janjoš,Marcel Hallgarten,Anthony Knittel,Maxim Dolgov,Andreas Zell,J. Marius Zöllner
発行日 2024-02-27 08:16:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク