Real-Time Siamese Multiple Object Tracker with Enhanced Proposals

要約

リアルタイム映像中の複数の物体の同一性を維持することは困難な課題であり、すべてのフレームで検出器を実行することは常に実行可能とは限らないからである。そのため、動き推定システムがしばしば採用されるが、これらはターゲットの数に対してうまくスケールしないか、あるいは意味情報が限られた特徴量を生成する。このような問題を解決し、数十個の任意の物体をリアルタイムで追跡することを可能にするために、我々はSiamMOTIONを提案します。SiamMOTIONは、注目機構と、慣性モジュールによって供給され、特徴ピラミッドネットワークによって駆動する関心領域抽出器を通じて、質の高い特徴を生成する新しい提案エンジンを含んでいる。最後に、抽出されたテンソルは比較ヘッドに入り、効率的に模範例と検索領域のペアをマッチングさせ、ペアワイズ深さ方向の領域提案ネットワークとマルチオブジェクト罰則モジュールによって品質予測を生成します。SiamMOTIONは、5つの公的ベンチマークで検証され、現在の最先端トラッカーに対してトップクラスの性能を達成しています。コードは、https://github.com/lorenzovaquero/SiamMOTION で入手可能です。

要約(オリジナル)

Maintaining the identity of multiple objects in real-time video is a challenging task, as it is not always feasible to run a detector on every frame. Thus, motion estimation systems are often employed, which either do not scale well with the number of targets or produce features with limited semantic information. To solve the aforementioned problems and allow the tracking of dozens of arbitrary objects in real-time, we propose SiamMOTION. SiamMOTION includes a novel proposal engine that produces quality features through an attention mechanism and a region-of-interest extractor fed by an inertia module and powered by a feature pyramid network. Finally, the extracted tensors enter a comparison head that efficiently matches pairs of exemplars and search areas, generating quality predictions via a pairwise depthwise region proposal network and a multi-object penalization module. SiamMOTION has been validated on five public benchmarks, achieving leading performance against current state-of-the-art trackers. Code available at: https://github.com/lorenzovaquero/SiamMOTION

arxiv情報

著者 Lorenzo Vaquero,Víctor M. Brea,Manuel Mucientes
発行日 2022-11-08 10:33:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク