Combining YOLO and Visual Rhythm for Vehicle Counting

要約

ビデオベースの車両検出と計数は、交通インフラの管理において重要な役割を果たします。
従来の画像ベースのカウント方法には、通常、最初の検出とその後の追跡という 2 つの主要なステップが含まれており、これらのステップはすべてのビデオ フレームに適用されるため、計算量が大幅に増加します。
この問題に対処するために、この研究では、車両の検出とカウントのための、より効率的な代替方法を提示します。
提案されたアプローチでは、追跡ステップの必要性がなくなり、主要なビデオ フレーム内の車両の検出のみに焦点が当てられるため、効率が向上します。
これを達成するために、私たちは車両検出用の YOLO と、有用な情報を含むフレームに焦点を合わせることができる時空間画像を作成する方法である Visual Rhythm を組み合わせたシステムを開発しました。
さらに、この方法は、検出および識別される一方向に移動するターゲットを含むあらゆるアプリケーションでの計数に使用できます。
実際のビデオを使用した実験分析では、提案された方法が、一連のビデオにわたって約 99.15% の平均計数精度を達成し、追跡ベースのアプローチよりも 3 倍速い処理速度を実現していることが示されています。

要約(オリジナル)

Video-based vehicle detection and counting play a critical role in managing transport infrastructure. Traditional image-based counting methods usually involve two main steps: initial detection and subsequent tracking, which are applied to all video frames, leading to a significant increase in computational complexity. To address this issue, this work presents an alternative and more efficient method for vehicle detection and counting. The proposed approach eliminates the need for a tracking step and focuses solely on detecting vehicles in key video frames, thereby increasing its efficiency. To achieve this, we developed a system that combines YOLO, for vehicle detection, with Visual Rhythm, a way to create time-spatial images that allows us to focus on frames that contain useful information. Additionally, this method can be used for counting in any application involving unidirectional moving targets to be detected and identified. Experimental analysis using real videos shows that the proposed method achieves mean counting accuracy around 99.15% over a set of videos, with a processing speed three times faster than tracking based approaches.

arxiv情報

著者 Victor Nascimento Ribeiro,Nina S. T. Hirata
発行日 2025-01-08 14:33:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク