Multi-view Tracking Using Weakly Supervised Human Motion Prediction

要約

人物追跡へのマルチビュー アプローチは、混雑したシーンでのシングルビューのアプローチよりもオクルージョンをより適切に処理できる可能性があります。
彼らは多くの場合、検出による追跡パラダイムに依存しています。これには、最初に人を検出し、次に検出を接続することが含まれます。
この論文では、さらに効果的なアプローチは、時間の経過に伴う人々の動きを予測し、これらから個々のフレームで人々の存在を推測することであると主張します。
これにより、時間の経過とともに、単一の時間フレームのビュー全体で一貫性を確保できます。
PETS2009 および WILDTRACK データセットでアプローチを検証し、最先端の方法よりも優れていることを実証します。

要約(オリジナル)

Multi-view approaches to people-tracking have the potential to better handle occlusions than single-view ones in crowded scenes. They often rely on the tracking-by-detection paradigm, which involves detecting people first and then connecting the detections. In this paper, we argue that an even more effective approach is to predict people motion over time and infer people’s presence in individual frames from these. This enables to enforce consistency both over time and across views of a single temporal frame. We validate our approach on the PETS2009 and WILDTRACK datasets and demonstrate that it outperforms state-of-the-art methods.

arxiv情報

著者 Martin Engilberge,Weizhe Liu,Pascal Fua
発行日 2022-10-19 17:58:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク