要約
マルチオブジェクト トラッキング (MOT) は、ビデオ内のオブジェクトの境界ボックスとアイデンティティを推定することを目的としています。
ほとんどの方法は、検出による追跡パラダイムと結合検出関連付けパラダイムに大まかに分類できます。
後者はより多くの注目を集めており、前者と比較して同等のパフォーマンスを示していますが、追跡精度の点では検出による追跡パラダイムが依然として最適なソリューションであると主張します。たとえば、80.3 MOTA、77.3 IDF1、および 63.1 を達成する ByteTrack などです。
単一の V100 GPU で 30 FPS の実行速度を備えた MOT17 のテスト セットでの HOTA。ただし、車両や UAV の加速などの複雑な観点では、均一なカルマン フィルターを使用するこのようなトラッカーのパフォーマンスは大きな影響を受け、追跡損失が発生します。
この論文では、環境フィードバックに基づいて可変速度カルマン フィルター アルゴリズムを提案し、マッチング プロセスを改善します。これにより、比較的静的なシーンで高い追跡精度を維持しながら、複雑な可変速度シーンでの追跡効果を大幅に向上させることができます。
最終的には、MOT17 テスト セットで ByteTrack よりも高い MOTA および IDF1 結果を達成できるようになります。
要約(オリジナル)
Multi-object tracking (MOT) aims at estimating bounding boxes and identities of objects in videos. Most methods can be roughly classified as tracking-by-detection and joint-detection-association paradigms. Although the latter has elicited more attention and demonstrates comparable performance relative than the former, we claim that the tracking-by-detection paradigm is still the optimal solution in terms of tracking accuracy,such as ByteTrack,which achieves 80.3 MOTA, 77.3 IDF1 and 63.1 HOTA on the test set of MOT17 with 30 FPS running speed on a single V100 GPU.However, under complex perspectives such as vehicle and UAV acceleration, the performance of such a tracker using uniform Kalman filter will be greatly affected, resulting in tracking loss.In this paper, we propose a variable speed Kalman filter algorithm based on environmental feedback and improve the matching process, which can greatly improve the tracking effect in complex variable speed scenes while maintaining high tracking accuracy in relatively static scenes. Eventually, higher MOTA and IDF1 results can be achieved on MOT17 test set than ByteTrack
arxiv情報
著者 | Run Luo,JinLin Wei,Qiao Lin |
発行日 | 2024-01-01 08:50:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google