STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking


無人航空機 (UAV) ビデオの複数オブジェクト追跡 (MOT) は、コンピューター ビジョンのさまざまなアプリケーションにとって重要です。
現在の MOT トラッカーは、正確な物体検出結果とターゲット再識別 (ReID) の正確な照合に依存しています。
フレームワーク (STCMOT)。履歴埋め込み機能を利用して、ReID の表現と検出機能を順番にモデル化します。
VisDrone2019 および UAVDT データセットに関する広範な実験により、STCMOT が MOTA および IDF1 メトリクスで新しい最先端のパフォーマンスを設定することが実証されました。
ソースコードは で公開されています。


Multiple object tracking (MOT) in Unmanned Aerial Vehicle (UAV) videos is important for diverse applications in computer vision. Current MOT trackers rely on accurate object detection results and precise matching of target reidentification (ReID). These methods focus on optimizing target spatial attributes while overlooking temporal cues in modelling object relationships, especially for challenging tracking conditions such as object deformation and blurring, etc. To address the above-mentioned issues, we propose a novel Spatio-Temporal Cohesion Multiple Object Tracking framework (STCMOT), which utilizes historical embedding features to model the representation of ReID and detection features in a sequential order. Concretely, a temporal embedding boosting module is introduced to enhance the discriminability of individual embedding based on adjacent frame cooperation. While the trajectory embedding is then propagated by a temporal detection refinement module to mine salient target locations in the temporal field. Extensive experiments on the VisDrone2019 and UAVDT datasets demonstrate our STCMOT sets a new state-of-the-art performance in MOTA and IDF1 metrics. The source codes are released at


著者 Jianbo Ma,Chuanming Tang,Fei Wu,Can Zhao,Jianlin Zhang,Zhiyong Xu
発行日 2024-09-17 14:34:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク