PriorMotion: Generative Class-Agnostic Motion Prediction with Raster-Vector Motion Field Priors


従来のアプローチは通常、オブジェクト中心のメソッドとクラスに依存しないメソッドの 2 つのカテゴリに分類されます。
オブジェクト中心の手法は検出の見逃しに苦戦し、動き予測の不正確さにつながることがよくありますが、クラスに依存しない手法の多くはエンコーダの設計に重点を置き、剛性や時間的一貫性などの重要な事前条件を見落とすことが多く、特にデータがまばらな LiDAR データの場合、次善のパフォーマンスにつながります。
これらの問題に対処するために、ラスター化およびベクトル化されたシーン表現を抽出して時空間事前分布をモデル化する生成フレームワーク $\textbf{PriorMotion}$ を提案します。
私たちのモデルは、BEV エンコーダー、ラスターベクトル事前エンコーダー、および時空間事前ジェネレーターで構成されており、動き予測における空間的および時間的一貫性の両方を向上させます。
nuScenes データセットの実験では、PriorMotion が最先端のパフォーマンスを達成していることが示され、高度な FMCW LiDAR でのさらなる検証により、その堅牢性が確認されました。


Reliable perception of spatial and motion information is crucial for safe autonomous navigation. Traditional approaches typically fall into two categories: object-centric and class-agnostic methods. While object-centric methods often struggle with missed detections, leading to inaccuracies in motion prediction, many class-agnostic methods focus heavily on encoder design, often overlooking important priors like rigidity and temporal consistency, leading to suboptimal performance, particularly with sparse LiDAR data at distant region. To address these issues, we propose $\textbf{PriorMotion}$, a generative framework that extracts rasterized and vectorized scene representations to model spatio-temporal priors. Our model comprises a BEV encoder, an Raster-Vector prior Encoder, and a Spatio-Temporal prior Generator, improving both spatial and temporal consistency in motion prediction. Additionally, we introduce a standardized evaluation protocol for class-agnostic motion prediction. Experiments on the nuScenes dataset show that PriorMotion achieves state-of-the-art performance, with further validation on advanced FMCW LiDAR confirming its robustness.


著者 Kangan Qian,Xinyu Jiao,Yining Shi,Yunlong Wang,Ziang Luo,Zheng Fu,Kun Jiang,Diange Yang
発行日 2024-12-05 09:56:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.PF, cs.RO パーマリンク