要約
視覚オブジェクト追跡の最近の進歩により、無人航空機(UAV)追跡の機能が著しく改善されました。これは、実際のロボット工学アプリケーションの重要なコンポーネントです。
階層的な軽量ネットワークの統合は、UAV追跡の効率を高めるための一般的な戦略となっていますが、多くの場合、ネットワーク容量の大幅な低下をもたらし、頻繁に閉塞したり、角度を見る際の極端な変化など、UAVシナリオの課題をさらに悪化させます。
これらの問題に対処するために、CGTrackと呼ばれるUAVトラッカーの新しいファミリーを紹介します。これは、明示的かつ暗黙的な手法を組み合わせて、粗からファインフレームワーク内でネットワーク容量を拡大します。
具体的には、最初に、機能の表現を強化しながら最小限の計算コストを発生させながら、深いセマンティックキューを豊富な空間情報と統合することにより、機能の再利用スピリットを活用するためにネットワーク容量を増加させる階層機能カスケード(HFC)モジュールを導入します。
これに基づいて、ゲーティングメカニズムを利用して、以前に拡張された特徴からターゲット指向の座標を分離する新しい軽量ゲートセンターヘッド(LGCH)を設計します。
3つの挑戦的なUAV追跡ベンチマークに関する広範な実験は、CGTRACKが最新のパフォーマンスを達成しながら速く実行することを示しています。
コードはhttps://github.com/nightwatch-fox11/cgtrackで入手できます。
要約(オリジナル)
Recent advancements in visual object tracking have markedly improved the capabilities of unmanned aerial vehicle (UAV) tracking, which is a critical component in real-world robotics applications. While the integration of hierarchical lightweight networks has become a prevalent strategy for enhancing efficiency in UAV tracking, it often results in a significant drop in network capacity, which further exacerbates challenges in UAV scenarios, such as frequent occlusions and extreme changes in viewing angles. To address these issues, we introduce a novel family of UAV trackers, termed CGTrack, which combines explicit and implicit techniques to expand network capacity within a coarse-to-fine framework. Specifically, we first introduce a Hierarchical Feature Cascade (HFC) module that leverages the spirit of feature reuse to increase network capacity by integrating the deep semantic cues with the rich spatial information, incurring minimal computational costs while enhancing feature representation. Based on this, we design a novel Lightweight Gated Center Head (LGCH) that utilizes gating mechanisms to decouple target-oriented coordinates from previously expanded features, which contain dense local discriminative information. Extensive experiments on three challenging UAV tracking benchmarks demonstrate that CGTrack achieves state-of-the-art performance while running fast. Code will be available at https://github.com/Nightwatch-Fox11/CGTrack.
arxiv情報
著者 | Weihong Li,Xiaoqiong Liu,Heng Fan,Libo Zhang |
発行日 | 2025-05-09 10:27:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google