A Hybrid Approach To Real-Time Multi-Object Tracking

要約

マルチターゲット トラッキングとも呼ばれるマルチオブジェクト トラッキングは、さまざまな設定で多くの用途があるコンピューター ビジョンの重要な分野です。
ディープラーニングの発展は、研究者がこの方向での研究をますます提案することを奨励し、追跡の研究やコンピュータビジョンに関連する他の多くの領域の科学の進歩に大きな影響を与えました。
実際、文献や追跡業界で現在最先端のソリューションはすべて、非常に優れた結果を生み出す深層学習手法に基づいて構築されています。
深層学習は、研究者がこれらのモデルに必要な大量の計算リソースを処理するために使用できる、これまで以上に強力なテクノロジーのおかげで可能になります。
ただし、リアルタイムが主な要件である場合、実世界の状況で追跡アプリケーションを拡大するには、膨大な計算リソースを備えた高価なハードウェア サポートに制約されない追跡システムを開発する必要があります。
この目的を達成するための妥協策は、強力なディープ戦略とより従来のアプローチを組み合わせて、リアルタイム ドメインには適しているものの、追跡結果の精度が低下する代わりに処理速度が大幅に低いソリューションを優先することです。
実際、現在の研究はその方向に進んでおり、古典的なオプティカル フロー アルゴリズムとディープ ラーニング アーキテクチャを効果的に組み合わせた、望ましいトレードオフを示す人間と群衆の追跡システムを対象とした、リアルタイム マルチターゲット追跡のためのハイブリッド戦略を提案しています。
追跡精度のパフォーマンスと計算コストの間で。
開発されたアーキテクチャはさまざまな設定で実験され、比較された最先端の結果である 0.549 のうち 0.608 の MOTA が得られ、オプティカル フロー フェーズを導入した場合の実行時間は約半分となり、ほぼ同じパフォーマンスを達成しました。
正確さ。

要約(オリジナル)

Multi-Object Tracking, also known as Multi-Target Tracking, is a significant area of computer vision that has many uses in a variety of settings. The development of deep learning, which has encouraged researchers to propose more and more work in this direction, has significantly impacted the scientific advancement around the study of tracking as well as many other domains related to computer vision. In fact, all of the solutions that are currently state-of-the-art in the literature and in the tracking industry, are built on top of deep learning methodologies that produce exceptionally good results. Deep learning is enabled thanks to the ever more powerful technology researchers can use to handle the significant computational resources demanded by these models. However, when real-time is a main requirement, developing a tracking system without being constrained by expensive hardware support with enormous computational resources is necessary to widen tracking applications in real-world contexts. To this end, a compromise is to combine powerful deep strategies with more traditional approaches to favor considerably lower processing solutions at the cost of less accurate tracking results even though suitable for real-time domains. Indeed, the present work goes in that direction, proposing a hybrid strategy for real-time multi-target tracking that combines effectively a classical optical flow algorithm with a deep learning architecture, targeted to a human-crowd tracking system exhibiting a desirable trade-off between performance in tracking precision and computational costs. The developed architecture was experimented with different settings, and yielded a MOTA of 0.608 out of the compared state-of-the-art 0.549 results, and about half the running time when introducing the optical flow phase, achieving almost the same performance in terms of accuracy.

arxiv情報

著者 Vincenzo Mariano Scarrica,Ciro Panariello,Alessio Ferone,Antonino Staiano
発行日 2023-08-02 16:02:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク