STT: Stateful Tracking with Transformers for Autonomous Driving


自動運転には、3 次元空間内の物体を追跡することが重要です。
この論文では、Transformers で構築されたステートフル トラッキング モデルである STT を提案します。これは、シーン内のオブジェクトを一貫して追跡しながら、その状態を正確に予測することができます。
STT は、長期にわたる検出履歴を通じて豊富な外観、ジオメトリ、モーション信号を消費し、データ関連付けタスクと状態推定タスクの両方に対して共同で最適化されます。
MOTA や MOTP などの標準的な追跡メトリクスでは、オブジェクトの状態の広範囲にわたる 2 つのタスクを組み合わせたパフォーマンスが捕捉されないため、この制限に対処する S-MOTA および MOTPS と呼ばれる新しいメトリクスを使用してそれらを拡張します。
STT は、Waymo Open Dataset 上で競争力のあるリアルタイム パフォーマンスを実現します。


Tracking objects in three-dimensional space is critical for autonomous driving. To ensure safety while driving, the tracker must be able to reliably track objects across frames and accurately estimate their states such as velocity and acceleration in the present. Existing works frequently focus on the association task while either neglecting the model performance on state estimation or deploying complex heuristics to predict the states. In this paper, we propose STT, a Stateful Tracking model built with Transformers, that can consistently track objects in the scenes while also predicting their states accurately. STT consumes rich appearance, geometry, and motion signals through long term history of detections and is jointly optimized for both data association and state estimation tasks. Since the standard tracking metrics like MOTA and MOTP do not capture the combined performance of the two tasks in the wider spectrum of object states, we extend them with new metrics called S-MOTA and MOTPS that address this limitation. STT achieves competitive real-time performance on the Waymo Open Dataset.


著者 Longlong Jing,Ruichi Yu,Xu Chen,Zhengli Zhao,Shiwei Sheng,Colin Graber,Qi Chen,Qinru Li,Shangxuan Wu,Han Deng,Sangjin Lee,Chris Sweeney,Qiurui He,Wei-Chih Hung,Tong He,Xingyi Zhou,Farshid Moussavi,Zijian Guo,Yin Zhou,Mingxing Tan,Weilong Yang,Congcong Li
発行日 2024-04-30 23:04:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク