An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

要約

広範囲かつきめ細かい車両検出は、インテリジェント運転システムの予防安全機能を実現する上で重要な役割を果たします。
ただし、長方形バウンディング ボックス (BBox) に基づく既存の車両検出方法では、広範囲の物体、特に長距離にある小さな物体の認識に苦労することがよくあります。
また、BBox 式では車両の詳細な幾何学的形状や姿勢情報を提供できません。
本稿では、単一カメラからの画像に基づいた、効率的な学習手法を組み込んだ、新しい広範囲擬似 3D 車両検出手法を提案します。
このモデルは、高解像度画像からの 2 つのサブウィンドウ画像を結合することによって取得される、結合された画像を入力として受け取ります。
この画像形式は、限られた画像解像度を最大限に活用して、広範囲の車両オブジェクトに関する重要な情報を保持します。
擬似3Dオブジェクトを検出するために、当社のモデルは特別に設計された検出ヘッドを採用しています。
これらのヘッドは、車両の形状とポーズをキャプチャする拡張 BBox と Side Projection Line (SPL) 表現を同時に出力し、高精度の検出を可能にします。
検出のパフォーマンスをさらに向上させるために、オブジェクト ボックスと SPL の両方を組み合わせたジョイント制約損失がモデルのトレーニング中に設計され、モデルの効率、安定性、予測精度が向上します。
独自に構築したデータセットの実験結果は、私たちのモデルが複数の評価指標にわたって広範囲の擬似 3D 車両検出において良好なパフォーマンスを達成していることを示しています。
デモビデオは https://www.youtube.com/watch?v=1gk1PmsQ5Q8 に掲載されています。

要約(オリジナル)

Wide-range and fine-grained vehicle detection plays a critical role in enabling active safety features in intelligent driving systems. However, existing vehicle detection methods based on rectangular bounding boxes (BBox) often struggle with perceiving wide-range objects, especially small objects at long distances. And BBox expression cannot provide detailed geometric shape and pose information of vehicles. This paper proposes a novel wide-range Pseudo-3D Vehicle Detection method based on images from a single camera and incorporates efficient learning methods. This model takes a spliced image as input, which is obtained by combining two sub-window images from a high-resolution image. This image format maximizes the utilization of limited image resolution to retain essential information about wide-range vehicle objects. To detect pseudo-3D objects, our model adopts specifically designed detection heads. These heads simultaneously output extended BBox and Side Projection Line (SPL) representations, which capture vehicle shapes and poses, enabling high-precision detection. To further enhance the performance of detection, a joint constraint loss combining both the object box and SPL is designed during model training, improving the efficiency, stability, and prediction accuracy of the model. Experimental results on our self-built dataset demonstrate that our model achieves favorable performance in wide-range pseudo-3D vehicle detection across multiple evaluation metrics. Our demo video has been placed at https://www.youtube.com/watch?v=1gk1PmsQ5Q8.

arxiv情報

著者 Zhupeng Ye,Yinqi Li,Zejian Yuan
発行日 2023-09-15 12:50:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク