Integrated Multiscale Domain Adaptive YOLO

要約

ドメイン適合の分野は、多くのアプリケーションで遭遇するドメインシフトの問題を解決するのに役立っている。この問題は、学習に使用するソースデータと現実的なテストシナリオで使用するターゲットデータの分布の違いによって発生する。本論文では、最近導入されたYOLOv4物体検出器の異なるスケールで複数の領域適応経路と対応する領域分類器を用いる新しいマルチスケールドメイン適応型YOLO(MS-DAYOLO)フレームワークを紹介する。ベースラインのマルチスケールDAYOLOフレームワークを基に、ドメイン不変な特徴を生成するドメイン適応ネットワーク(DAN)のための3つの新規な深層学習アーキテクチャを紹介する。特に、Progressive Feature Reduction (PFR)、Unified Classifier (UC)、そしてIntegrated Architectureを提案する。我々は、提案するDANアーキテクチャをYOLOv4と連携させ、一般的なデータセットを用いて学習とテストを行う。提案するMS-DAYOLOアーキテクチャを用いてYOLOv4を学習させ、自律走行アプリケーションのターゲットデータでテストしたところ、物体検出性能が大幅に向上することが実験により確認された。さらに、MS-DAYOLOフレームワークは、同等の物体検出性能を提供しながら、Faster R-CNNソリューションと比較して、1桁のリアルタイム速度向上を達成する。

要約(オリジナル)

The area of domain adaptation has been instrumental in addressing the domain shift problem encountered by many applications. This problem arises due to the difference between the distributions of source data used for training in comparison with target data used during realistic testing scenarios. In this paper, we introduce a novel MultiScale Domain Adaptive YOLO (MS-DAYOLO) framework that employs multiple domain adaptation paths and corresponding domain classifiers at different scales of the recently introduced YOLOv4 object detector. Building on our baseline multiscale DAYOLO framework, we introduce three novel deep learning architectures for a Domain Adaptation Network (DAN) that generates domain-invariant features. In particular, we propose a Progressive Feature Reduction (PFR), a Unified Classifier (UC), and an Integrated architecture. We train and test our proposed DAN architectures in conjunction with YOLOv4 using popular datasets. Our experiments show significant improvements in object detection performance when training YOLOv4 using the proposed MS-DAYOLO architectures and when tested on target data for autonomous driving applications. Moreover, MS-DAYOLO framework achieves an order of magnitude real-time speed improvement relative to Faster R-CNN solutions while providing comparable object detection performance.

arxiv情報

著者 Mazin Hnewa,Hayder Radha
発行日 2022-07-04 16:45:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク