DeTra: A Unified Model for Object Detection and Trajectory Forecasting

要約

物体検出と軌道予測のタスクは、自動運転の現場を理解する上で重要な役割を果たします。
これらのタスクは通常、カスケード方式で実行されるため、複合エラーが発生しやすくなります。
さらに、通常、2 つのタスク間には非常に薄いインターフェイスがあり、損失の多い情報のボトルネックが生じます。
これらの課題に対処するために、私たちのアプローチは 2 つのタスクの結合を軌道改良問題として定式化します。最初のポーズは検出 (現在時間) であり、後続のポーズは複数の予測のウェイポイント (将来時間) です。
この統合タスクに取り組むために、LiDAR 点群と高解像度マップからオブジェクトの存在、姿勢、およびマルチモーダルな将来の動作を直接推論するリファインメント トランスフォーマーを設計します。
私たちはこのモデルを DeTra (オブジェクト検出と軌道予測の略) と呼びます。
私たちの実験では、 \ourmodel{} が Argoverse 2 Sensor と Waymo Open Dataset の最先端のパフォーマンスを、幅広い指標にわたって大幅に上回っていることが観察されました。
最後に重要なことですが、私たちは広範なアブレーション研究を実施し、このタスクを改良することの価値、提案されたすべてのコンポーネントがそのパフォーマンスにプラスに貢献していること、重要な設計上の選択が行われたことを示しています。

要約(オリジナル)

The tasks of object detection and trajectory forecasting play a crucial role in understanding the scene for autonomous driving. These tasks are typically executed in a cascading manner, making them prone to compounding errors. Furthermore, there is usually a very thin interface between the two tasks, creating a lossy information bottleneck. To address these challenges, our approach formulates the union of the two tasks as a trajectory refinement problem, where the first pose is the detection (current time), and the subsequent poses are the waypoints of the multiple forecasts (future time). To tackle this unified task, we design a refinement transformer that infers the presence, pose, and multi-modal future behaviors of objects directly from LiDAR point clouds and high-definition maps. We call this model DeTra, short for object Detection and Trajectory forecasting. In our experiments, we observe that \ourmodel{} outperforms the state-of-the-art on Argoverse 2 Sensor and Waymo Open Dataset by a large margin, across a broad range of metrics. Last but not least, we perform extensive ablation studies that show the value of refinement for this task, that every proposed component contributes positively to its performance, and that key design choices were made.

arxiv情報

著者 Sergio Casas,Ben Agro,Jiageng Mao,Thomas Gilles,Alexander Cui,Thomas Li,Raquel Urtasun
発行日 2024-06-13 12:54:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク