要約
都市の交通環境では、特に電動スクーターや自転車などの超小型モビリティ車両の存在が増加しているため、物体検出に特有の課題が生じています。
この物体検出の問題に対処するために、この研究では、単一フレームの物体検出の精度と速度と、ビデオ オブジェクト検出フレームワークが提供する豊富な機能を組み合わせた、適応された検出モデルを導入します。
これは、モーション フローを通じて処理された連続フレームから集約された特徴マップを YOLOX アーキテクチャに適用することによって行われます。
この融合により、YOLOX の検出能力に時間的な視点がもたらされ、都市のモビリティ パターンをより深く理解できるようになり、検出の信頼性が大幅に向上します。
都市部のマイクロモビリティのシナリオ向けに厳選されたカスタム データセットでテストされた私たちのモデルは、既存の最先端の手法に比べて大幅な改善が見られ、このような小さくて薄い物体を検出するには時空間情報を考慮する必要があることを示しています。
私たちのアプローチは、オクルージョンなどの困難な状況での検出を強化し、時間的な一貫性を確保し、モーション ブラーを効果的に軽減します。
要約(オリジナル)
Urban traffic environments present unique challenges for object detection, particularly with the increasing presence of micromobility vehicles like e-scooters and bikes. To address this object detection problem, this work introduces an adapted detection model that combines the accuracy and speed of single-frame object detection with the richer features offered by video object detection frameworks. This is done by applying aggregated feature maps from consecutive frames processed through motion flow to the YOLOX architecture. This fusion brings a temporal perspective to YOLOX detection abilities, allowing for a better understanding of urban mobility patterns and substantially improving detection reliability. Tested on a custom dataset curated for urban micromobility scenarios, our model showcases substantial improvement over existing state-of-the-art methods, demonstrating the need to consider spatio-temporal information for detecting such small and thin objects. Our approach enhances detection in challenging conditions, including occlusions, ensuring temporal consistency, and effectively mitigating motion blur.
arxiv情報
著者 | Khalil Sabri,Célia Djilali,Guillaume-Alexandre Bilodeau,Nicolas Saunier,Wassim Bouachir |
発行日 | 2024-10-30 15:16:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google