要約
Anti-UAV追跡は、ターゲットサイズの小さなサイズ、急激なカメラの動き、散らかった赤外線の背景など、重大な課題をもたらします。
既存の追跡パラダイムは、グローバルおよびローカルベースの方法に広く分類できます。
SIAMDTなどのグローバルベースのトラッカーは、視野全体をスキャンすることにより高い精度を達成しますが、過度の計算オーバーヘッドに苦しみ、実際の展開が制限されます。
対照的に、OstrackやRomtrackを含むローカルベースの方法は、検索領域を効率的に制限しますが、ターゲットがカメラの動きが急激になったために大きな変位を受ける場合に闘争します。
予備的な実験を通じて、ローカルトラッカーは、適応型検索領域の調整と組み合わせた場合、トラッキングの精度を大幅に向上させ、ローカルトラッカーとグローバルトラッカーの間のギャップを狭めることができることが明らかです。
この課題に対処するために、検索領域を動的に洗練し、特徴表現を強化する新しいフレームワークであるFocustrackを提案し、計算効率と追跡精度の間の最適なバランスを達成します。
具体的には、検索領域調整(SRA)戦略は、ターゲットの存在確率を推定し、視野を適応的に調整し、ターゲットが焦点を維持することを保証します。
さらに、さまざまな検索領域によって引き起こされる機能の劣化に対抗するために、マスク(ATM)モジュールが提案されています。
このモジュールは、階層情報を統合し、ターゲット表現を細かい詳細で濃縮します。
実験結果は、Focustrackが最先端のパフォーマンスを達成し、AntIUAVで67.7%AUC、AntiUAV410で62.8%AUCを獲得し、それぞれベースライントラッカーを8.5%および9.1%AUCよりも上回ることを示しています。
効率の観点から、Focustrackはグローバルベースのトラッカーを超えており、30gのMacのみを必要とし、Focustrack(SRA)で143 FPSとフルバージョンで44 FPSを達成し、どちらもリアルタイム追跡を可能にします。
要約(オリジナル)
Anti-UAV tracking poses significant challenges, including small target sizes, abrupt camera motion, and cluttered infrared backgrounds. Existing tracking paradigms can be broadly categorized into global- and local-based methods. Global-based trackers, such as SiamDT, achieve high accuracy by scanning the entire field of view but suffer from excessive computational overhead, limiting real-world deployment. In contrast, local-based methods, including OSTrack and ROMTrack, efficiently restrict the search region but struggle when targets undergo significant displacements due to abrupt camera motion. Through preliminary experiments, it is evident that a local tracker, when paired with adaptive search region adjustment, can significantly enhance tracking accuracy, narrowing the gap between local and global trackers. To address this challenge, we propose FocusTrack, a novel framework that dynamically refines the search region and strengthens feature representations, achieving an optimal balance between computational efficiency and tracking accuracy. Specifically, our Search Region Adjustment (SRA) strategy estimates the target presence probability and adaptively adjusts the field of view, ensuring the target remains within focus. Furthermore, to counteract feature degradation caused by varying search regions, the Attention-to-Mask (ATM) module is proposed. This module integrates hierarchical information, enriching the target representations with fine-grained details. Experimental results demonstrate that FocusTrack achieves state-of-the-art performance, obtaining 67.7% AUC on AntiUAV and 62.8% AUC on AntiUAV410, outperforming the baseline tracker by 8.5% and 9.1% AUC, respectively. In terms of efficiency, FocusTrack surpasses global-based trackers, requiring only 30G MACs and achieving 143 fps with FocusTrack (SRA) and 44 fps with the full version, both enabling real-time tracking.
arxiv情報
著者 | Ying Wang,Tingfa Xu,Jianan Li |
発行日 | 2025-04-18 10:18:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google