Cross-Domain Car Detection Model with Integrated Convolutional Block Attention Mechanism

要約

特にカメラ ビジョンによる自動車の検出は、コンピューター ビジョンの分野で大きな注目を集めており、広く採用されています。
現在の自動車検出システムは優れた検出能力を備えていますが、自動車間の近さ、光の強さ、環境の可視性などの要因により、信頼性の高い検出は依然として困難な場合があります。
これらの問題に対処するために、私たちは統合された畳み込みブロック アテンション メカニズム (CDMA) を備えたクロスドメイン自動車検出モデルを提案し、自動運転やその他の分野の自動車認識に適用します。
CDMA にはいくつかの新しい点があります。 1) 完全なクロスドメイン ターゲット検出フレームワークの構築。
2)特に車のヘッドライトの機能を強調する、統合された畳み込み注意メカニズムを備えた、ペアになっていないターゲット ドメイン画像生成モジュールを開発します。
3)ターゲット検出フレームワークの損失関数として一般化交差オーバーユニオン(GIOU)を採用します。
4)双頭畳み込みブロックアテンションモジュール(CBAM)と統合された物体検出モデルを設計する。
5)効果的なデータ強化方法を利用する。
モデルの有効性を評価するために、SSLAD データセット内のデータに対して縮小遺言解決プロセスを実行し、それをタスクのベンチマーク データセットとして使用しました。
実験結果は、クロスドメインの自動車ターゲット検出モデルのパフォーマンスが、フレームワークなしのモデルと比べて 40% 向上し、私たちの改善がクロスドメインの自動車認識に大きな影響を与えることを示しています。

要約(オリジナル)

Car detection, particularly through camera vision, has become a major focus in the field of computer vision and has gained widespread adoption. While current car detection systems are capable of good detection, reliable detection can still be challenging due to factors such as proximity between the car, light intensity, and environmental visibility. To address these issues, we propose cross-domain Car Detection Model with integrated convolutional block Attention mechanism(CDMA) that we apply to car recognition for autonomous driving and other areas. CDMA includes several novelties: 1)Building a complete cross-domain target detection framework. 2)Developing an unpaired target domain picture generation module with an integrated convolutional attention mechanism which specifically emphasizes the car headlights feature. 3)Adopting Generalized Intersection over Union (GIOU) as the loss function of the target detection framework. 4)Designing an object detection model integrated with two-headed Convolutional Block Attention Module(CBAM). 5)Utilizing an effective data enhancement method. To evaluate the model’s effectiveness, we performed a reduced will resolution process on the data in the SSLAD dataset and used it as the benchmark dataset for our task. Experimental results show that the performance of the cross-domain car target detection model improves by 40% over the model without our framework, and our improvements have a significant impact on cross-domain car recognition.

arxiv情報

著者 Haoxuan Xu,Songning Lai,Xianyang Li,Yang Yang
発行日 2023-06-21 11:34:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク