要約
本稿では、交通カメラの映像から車速を推定するための計算効率の高い手法を紹介する。2次元検出と消失点ジオメトリから得られた3次元バウンディングボックスを利用する先行研究をベースに、リアルタイム性能を向上させるためのいくつかの改良点を導入する。BrnoCompSpeedデータセットを用いて、車両検出と速度推定精度の観点から、いくつかのバリエーションで本手法を評価する。エッジデバイスを含む様々なハードウェアプラットフォームにわたる広範な評価により、速度推定精度を同等または向上させながら、従来の最先端技術と比較してフレーム/秒(FPS)が大幅に向上していることが実証された。精度と計算コストのトレードオフを分析し、学習後の量子化を利用したより小さなモデルが実世界での展開に最適なバランスを提供することを示す。我々の最高性能モデルは、車速推定誤差の中央値(0.58km/h 対 0.60km/h)、検出精度(91.02% 対 87.08%)、再現率(91.14% 対 83.32%)の点で従来の最先端技術を上回ると同時に、5.5倍高速である。
要約(オリジナル)
This paper presents a computationally efficient method for vehicle speed estimation from traffic camera footage. Building upon previous work that utilizes 3D bounding boxes derived from 2D detections and vanishing point geometry, we introduce several improvements to enhance real-time performance. We evaluate our method in several variants on the BrnoCompSpeed dataset in terms of vehicle detection and speed estimation accuracy. Our extensive evaluation across various hardware platforms, including edge devices, demonstrates significant gains in frames per second (FPS) compared to the prior state-of-the-art, while maintaining comparable or improved speed estimation accuracy. We analyze the trade-off between accuracy and computational cost, showing that smaller models utilizing post-training quantization offer the best balance for real-world deployment. Our best performing model beats previous state-of-the-art in terms of median vehicle speed estimation error (0.58 km/h vs. 0.60 km/h), detection precision (91.02% vs 87.08%) and recall (91.14% vs. 83.32%) while also being 5.5 times faster.
arxiv情報
| 著者 | Andrej Macko,Lukáš Gajdošech,Viktor Kocur |
| 発行日 | 2025-05-02 11:48:11+00:00 |
| arxivサイト | arxiv_id(pdf) |