要約
Group Dance Multiple People Tracking Challenge の第 1 位のソリューションを紹介します。
MOTR: End-to-End Multiple-Object Tracking with Transformer に基づいて、1) アンカーとしてのクエリの検出、2) クエリのノイズ除去としての追跡、3) CrowdHuman データセットから生成された疑似ビデオ クリップの共同トレーニング、および 4) の使用
検出クエリのアンカー初期化のための YOLOX 検出提案。
私たちの方法は、DanceTrack テスト セットで 73.4% HOTA を達成し、2 位のソリューションを +6.8% HOTA 上回っています。
要約(オリジナル)
We present our 1st place solution to the Group Dance Multiple People Tracking Challenge. Based on MOTR: End-to-End Multiple-Object Tracking with Transformer, we explore: 1) detect queries as anchors, 2) tracking as query denoising, 3) joint training on pseudo video clips generated from CrowdHuman dataset, and 4) using the YOLOX detection proposals for the anchor initialization of detect queries. Our method achieves 73.4% HOTA on the DanceTrack test set, surpassing the second-place solution by +6.8% HOTA.
arxiv情報
著者 | Yuang Zhang,Tiancai Wang,Weiyao Lin,Xiangyu Zhang |
発行日 | 2022-10-27 09:28:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google