Motion-based Post-Processing: Using Kalman Filter to Exclude Similar Targets in Underwater Object Tracking

要約

ビジュアルトラッカーは、ネットワークと後処理を含みます。水中画像は色の歪みやコントラストが低いにもかかわらず、ディープラーニングによってネットワークがターゲットの外観特徴を識別できるようになるため、先進のトラッカーは水中物体追跡において非常に優位に立つことができます。しかし、水中での物体追跡は、別の問題にも直面しています。魚やイルカなどの水中ターゲットは通常、集団で出現し、同じ種の生物は通常、外観特徴の表現が似ているため、ネットワーク自身だけで弱い差異特徴を識別することは困難です。また、既存の検出ベースの後処理は、単一フレームの検出結果を反映するだけであり、類似したターゲットの中から真のターゲットを見つけ出すことはできない。本論文では、カルマンフィルタ(KF)を用いて、ターゲットの動き情報を保持し、周囲の類似ターゲットを排除する、動きに基づく新しい後処理戦略を提案する。具体的には、KFで予測されたボックスと応答マップの候補ボックスとその信頼度を用いて、候補位置スコアを計算し、真のターゲットを発見する。本手法は、ネットワーク構造を変更することなく、また、トラッカーの追加学習も行いません。類似のターゲット問題を持つ他の追跡分野にもすぐに適用できる。我々は、本手法に基づきSOTAトラッカーを改良し、UOT100とUTB180で本手法の有効性を証明した。OSTrackの類似部分文に対する我々の手法のAUCは平均3%以上改善され、精度、正規化精度も平均3.5%以上改善された。本手法は類似対象問題への対応において良好な互換性を持ち、他の手法とともに追跡器の性能を向上させることができることが証明された。より詳細な情報は https://github.com/LiYunfengLYF/KF_in_underwater_trackers に掲載されています。

要約(オリジナル)

Visual tracker includes network and post-processing. Despite the color distortion and low contrast of underwater images, advanced trackers can still be very competitive in underwater object tracking because deep learning empowers the networks to discriminate the appearance features of the target. However, underwater object tracking also faces another problem. Underwater targets such as fish and dolphins, usually appear in groups, and creatures of the same species usually have similar expressions of appearance features, so it is challenging to distinguish the weak differences characteristics only by the network itself. The existing detection-based post-processing only reflects the results of single frame detection, but cannot locate real targets among similar targets. In this paper, we propose a new post-processing strategy based on motion, which uses Kalman filter (KF) to maintain the motion information of the target and exclude similar targets around. Specifically, we use the KF predicted box and the candidate boxes in the response map and their confidence to calculate the candidate location score to find the real target. Our method does not change the network structure, nor does it perform additional training for the tracker. It can be quickly applied to other tracking fields with similar target problem. We improved SOTA trackers based on our method, and proved the effectiveness of our method on UOT100 and UTB180. The AUC of our method for OSTrack on similar subsequences is improved by more than 3% on average, and the precision and normalization precision are improved by more than 3.5% on average. It has been proved that our method has good compatibility in dealing with similar target problems and can enhance performance of the tracker together with other methods. More details can be found in: https://github.com/LiYunfengLYF/KF_in_underwater_trackers.

arxiv情報

著者 Yunfeng Li,Bo Wang,Ye Li,Wei Huo,Zhuoyan Liu
発行日 2023-01-04 08:22:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク