要約
この研究では、時空間物体検出モデルの開発を通じて、UAV カメラを使用したマルチクラス車両検出の進歩を紹介します。
この研究では、UAV によってキャプチャされた 6,600 個の注釈付き連続フレーム画像を含む時空間車両検出データセット (STVD) が導入され、全体的な時空間認識のためのアルゴリズムの包括的なトレーニングと評価が可能になります。
YOLO ベースの物体検出アルゴリズムが強化され、時間ダイナミクスが組み込まれ、単一フレーム モデルよりもパフォーマンスが向上しました。
注意メカニズムを時空間モデルに統合すると、パフォーマンスがさらに向上することが示されています。
実験による検証では大幅な進歩が実証され、最良の時空間モデルは単一フレーム モデルと比較して 16.22% の改善を示し、同時に注意メカニズムがさらなるパフォーマンス向上の可能性を秘めていることが実証されました。
要約(オリジナル)
This work presents advancements in multi-class vehicle detection using UAV cameras through the development of spatiotemporal object detection models. The study introduces a Spatio-Temporal Vehicle Detection Dataset (STVD) containing 6, 600 annotated sequential frame images captured by UAVs, enabling comprehensive training and evaluation of algorithms for holistic spatiotemporal perception. A YOLO-based object detection algorithm is enhanced to incorporate temporal dynamics, resulting in improved performance over single frame models. The integration of attention mechanisms into spatiotemporal models is shown to further enhance performance. Experimental validation demonstrates significant progress, with the best spatiotemporal model exhibiting a 16.22% improvement over single frame models, while it is demonstrated that attention mechanisms hold the potential for additional performance gains.
arxiv情報
著者 | Kristina Telegraph,Christos Kyrkou |
発行日 | 2024-10-17 14:49:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google