Estimating Vehicle Speed on Roadways Using RNNs and Transformers: A Video-based Approach

要約

このプロジェクトでは、高度な機械学習モデル、特に長期メモリ(LSTM)、ゲート再発ユニット(GRU)、および変圧器の適用を、ビデオデータを使用した車両速度推定のタスクに探索します。
レーダーや手動システムなどの従来の速度推定方法は、多くの場合、高コスト、限られたカバレッジ、および潜在的な混乱によって制約されます。
対照的に、既存の監視インフラストラクチャと最先端のニューラルネットワークアーキテクチャを活用すると、邪魔にならないスケーラブルなソリューションが提示されます。
私たちのアプローチはLSTMとGRUを利用してビデオフレームの時間的シーケンス内で長期的な依存関係を効果的に管理しますが、変圧器は自己関節メカニズムを活用するために使用され、シーケンス全体の処理を並行して処理し、最も有益なセグメントに焦点を合わせます。
データ。
この研究は、LSTMとGRUの両方が、高度なゲーティングメカニズムのために基本的な再発性ニューラルネットワーク(RNN)を上回ることを示しています。
さらに、入力データのシーケンス長を増やすと、モデルの精度が一貫して改善され、動的環境でのコンテキスト情報の重要性が強調されます。
特に、変圧器は、さまざまなシーケンスの長さと複雑さにわたって並外れた適応性と堅牢性を示しているため、さまざまな交通条件でのリアルタイムアプリケーションに非常に適しています。
調査結果は、これらの洗練されたニューラルネットワークモデルを統合することで、自動速度検出システムの精度と信頼性を大幅に向上させ、交通管理と交通安全に革命をもたらすことを約束することを示唆しています。

要約(オリジナル)

This project explores the application of advanced machine learning models, specifically Long Short-Term Memory (LSTM), Gated Recurrent Units (GRU), and Transformers, to the task of vehicle speed estimation using video data. Traditional methods of speed estimation, such as radar and manual systems, are often constrained by high costs, limited coverage, and potential disruptions. In contrast, leveraging existing surveillance infrastructure and cutting-edge neural network architectures presents a non-intrusive, scalable solution. Our approach utilizes LSTM and GRU to effectively manage long-term dependencies within the temporal sequence of video frames, while Transformers are employed to harness their self-attention mechanisms, enabling the processing of entire sequences in parallel and focusing on the most informative segments of the data. This study demonstrates that both LSTM and GRU outperform basic Recurrent Neural Networks (RNNs) due to their advanced gating mechanisms. Furthermore, increasing the sequence length of input data consistently improves model accuracy, highlighting the importance of contextual information in dynamic environments. Transformers, in particular, show exceptional adaptability and robustness across varied sequence lengths and complexities, making them highly suitable for real-time applications in diverse traffic conditions. The findings suggest that integrating these sophisticated neural network models can significantly enhance the accuracy and reliability of automated speed detection systems, thus promising to revolutionize traffic management and road safety.

arxiv情報

著者 Sai Krishna Reddy Mareddy,Dhanush Upplapati,Dhanush Kumar Antharam
発行日 2025-02-21 15:51:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク