Progressive Scaling Visual Object Tracking

要約

この作業では、視覚的なオブジェクト追跡のためのプログレッシブスケーリングトレーニング戦略を提案し、追跡パフォーマンスに対するトレーニングデータのボリューム、モデルサイズ、および入力解像度の影響を体系的に分析します。
私たちの経験的研究は、各要因をスケーリングすることで追跡精度の大幅な改善につながる一方で、ナイーブトレーニングは最適ではない最適化と限られた反復改良に苦しんでいることが明らかになりました。
この問題に対処するために、小規模な教師の転送とデュアルブランチのアライメントを統合してモデルのポテンシャルを最大化するプログレッシブスケーリングフレームワークであるDT-Trainingを紹介します。
結果のスケーリングされたトラッカーは、一貫して複数のベンチマークで最先端のメソッドを上回り、提案された方法の強力な一般化と転送可能性を示しています。
さらに、追加のタスクに対するアプローチのより広範な適用性を検証し、追跡を超えてその汎用性を強調しています。

要約(オリジナル)

In this work, we propose a progressive scaling training strategy for visual object tracking, systematically analyzing the influence of training data volume, model size, and input resolution on tracking performance. Our empirical study reveals that while scaling each factor leads to significant improvements in tracking accuracy, naive training suffers from suboptimal optimization and limited iterative refinement. To address this issue, we introduce DT-Training, a progressive scaling framework that integrates small teacher transfer and dual-branch alignment to maximize model potential. The resulting scaled tracker consistently outperforms state-of-the-art methods across multiple benchmarks, demonstrating strong generalization and transferability of the proposed method. Furthermore, we validate the broader applicability of our approach to additional tasks, underscoring its versatility beyond tracking.

arxiv情報

著者 Jack Hong,Shilin Yan,Zehao Xiao,Jiayin Cai,Xiaolong Jiang,Yao Hu,Henghui Ding
発行日 2025-05-26 13:45:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク