ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models

要約

自動駐車場は、高度なドライバーアシスタンスシステム(ADA)の重要な機能であり、知覚と計画モジュールを橋渡しするために正確な軌道予測が不可欠です。
その重要性にもかかわらず、このドメインでの研究は比較的限られたままであり、ほとんどの既存の研究は車両の単一モーダル軌道予測に集中しています。
この作業では、自動駐車場のシナリオで車両と歩行者の両方の軌跡を予測する新しいアプローチであるParkDiffusionを提案します。
ParkDiffusionは拡散モデルを採用して、将来の軌跡の固有の不確実性とマルチモダリティをキャプチャし、いくつかの重要な革新を取り入れています。
まず、2段階のクロスアテナンスメカニズムを使用して、ソフトセマンティックキューとハード幾何学的制約を処理するデュアルマップエンコーダーを提案します。
次に、適応エージェントタイプの埋め込みモジュールを導入します。これにより、車両と歩行者の明確な特性に関する予測プロセスが動的に条件付けられます。
第三に、運動学的な実現可能性を確保するために、モデルは運動学的軌道を生成するために運動学的フレームワーク内でその後使用される制御信号を出力します。
Dragon Lake Parking(DLP)データセットと交差点ドローン(IND)データセットのParkDiffusionを評価します。
私たちの仕事は、駐車場のシナリオにおける不均一な軌跡予測のための新しいベースラインを確立し、既存の方法をかなりのマージンで上回ります。

要約(オリジナル)

Automated parking is a critical feature of Advanced Driver Assistance Systems (ADAS), where accurate trajectory prediction is essential to bridge perception and planning modules. Despite its significance, research in this domain remains relatively limited, with most existing studies concentrating on single-modal trajectory prediction of vehicles. In this work, we propose ParkDiffusion, a novel approach that predicts the trajectories of both vehicles and pedestrians in automated parking scenarios. ParkDiffusion employs diffusion models to capture the inherent uncertainty and multi-modality of future trajectories, incorporating several key innovations. First, we propose a dual map encoder that processes soft semantic cues and hard geometric constraints using a two-step cross-attention mechanism. Second, we introduce an adaptive agent type embedding module, which dynamically conditions the prediction process on the distinct characteristics of vehicles and pedestrians. Third, to ensure kinematic feasibility, our model outputs control signals that are subsequently used within a kinematic framework to generate physically feasible trajectories. We evaluate ParkDiffusion on the Dragon Lake Parking (DLP) dataset and the Intersections Drone (inD) dataset. Our work establishes a new baseline for heterogeneous trajectory prediction in parking scenarios, outperforming existing methods by a considerable margin.

arxiv情報

著者 Jiarong Wei,Niclas Vödisch,Anna Rehr,Christian Feist,Abhinav Valada
発行日 2025-05-01 15:16:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク