Delving into the Trajectory Long-tail Distribution for Muti-object Tracking

要約

複数オブジェクト追跡 (MOT) は、コンピュータ ビジョンの重要な領域であり、幅広い実用的な実装が行われています。
現在の研究は主に、追跡アルゴリズムの開発と後処理技術の強化に焦点を当てています。
しかし、追跡データ自体の性質に関する徹底的な調査は行われていません。
この研究では、追跡データの分布パターンの調査に先駆けて、既存の MOT データセット内の顕著なロングテール分布の問題を特定します。
我々は、異なる歩行者間の軌跡の長さの分布が著しく不均衡であることに気づき、この現象を「歩行者の軌跡のロングテール分布」と呼んでいます。
この課題に対処するために、この偏った分布の影響を軽減するように設計されたオーダーメイドの戦略を導入します。
具体的には、視点状態と Re-ID 用の Group Softmax (GS) モジュール用に設計された、固定カメラ ビュー データ拡張 (SVA) と動的カメラ ビュー データ拡張 (DVA) を含む 2 つのデータ拡張戦略を提案します。
SVA はテールクラスの歩行者の軌跡をバックトラックして予測するもので、DVA は拡散モデルを使用してシーンの背景を変更するものです。
GS は歩行者を無関係なグループに分割し、各グループに対して個別にソフトマックス演算を実行します。
私たちが提案した戦略は、多数の既存の追跡システムに統合でき、広範囲にわたる実験により、マルチオブジェクト追跡パフォーマンスに対するロングテール分布の影響を軽減する私たちの方法の有効性が検証されています。
コードは https://github.com/chen-si-jia/Trajectory-Long-tail-Distribution-for-MOT で入手できます。

要約(オリジナル)

Multiple Object Tracking (MOT) is a critical area within computer vision, with a broad spectrum of practical implementations. Current research has primarily focused on the development of tracking algorithms and enhancement of post-processing techniques. Yet, there has been a lack of thorough examination concerning the nature of tracking data it self. In this study, we pioneer an exploration into the distribution patterns of tracking data and identify a pronounced long-tail distribution issue within existing MOT datasets. We note a significant imbalance in the distribution of trajectory lengths across different pedestrians, a phenomenon we refer to as “pedestrians trajectory long-tail distribution”. Addressing this challenge, we introduce a bespoke strategy designed to mitigate the effects of this skewed distribution. Specifically, we propose two data augmentation strategies, including Stationary Camera View Data Augmentation (SVA) and Dynamic Camera View Data Augmentation (DVA) , designed for viewpoint states and the Group Softmax (GS) module for Re-ID. SVA is to backtrack and predict the pedestrian trajectory of tail classes, and DVA is to use diffusion model to change the background of the scene. GS divides the pedestrians into unrelated groups and performs softmax operation on each group individually. Our proposed strategies can be integrated into numerous existing tracking systems, and extensive experimentation validates the efficacy of our method in reducing the influence of long-tail distribution on multi-object tracking performance. The code is available at https://github.com/chen-si-jia/Trajectory-Long-tail-Distribution-for-MOT.

arxiv情報

著者 Sijia Chen,En Yu,Jinyang Li,Wenbing Tao
発行日 2024-05-24 14:23:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク