Domain Generalisation for Object Detection under Covariate and Concept Shift

要約

ドメイン一般化は、ドメイン固有の特徴を抑制しながら、ドメイン不変の特徴の学習を促進することを目的としており、これにより、これまでに存在しなかったターゲット ドメインに対してモデルをより適切に一般化できるようになります。
物体検出のための領域一般化へのアプローチが提案されており、あらゆる物体検出アーキテクチャに適用できる最初のアプローチです。
厳密な数学的分析に基づいて、画像レベルでドメイン全体の周辺特徴分布を調整することに加えて、インスタンス レベルでクラス条件付きアライメントを実行するための新しいコンポーネントを使用して、特徴アライメントに基づくアプローチを拡張します。
これにより、ドメイン シフトの両方のコンポーネント、つまり共変量と概念シフトに完全に対処し、ドメインに依存しない特徴表現を学習できるようになります。
自動運転アプリケーション (Cityscapes、BDD10K、ACDC、IDD) および GWHD 用のいくつかの異なるデータセットで構成される新しく提案されたベンチマークで、1 段階 (FCOS、YOLO) と 2 段階 (FRCNN) 検出器の両方を使用して広範な評価を実行します。
精密農業向けのデータセットであり、ベースラインや最先端の​​ものと比較して、一般化と位置特定のパフォーマンスが一貫して向上していることを示しています。

要約(オリジナル)

Domain generalisation aims to promote the learning of domain-invariant features while suppressing domain-specific features, so that a model can generalise better to previously unseen target domains. An approach to domain generalisation for object detection is proposed, the first such approach applicable to any object detection architecture. Based on a rigorous mathematical analysis, we extend approaches based on feature alignment with a novel component for performing class conditional alignment at the instance level, in addition to aligning the marginal feature distributions across domains at the image level. This allows us to fully address both components of domain shift, i.e. covariate and concept shift, and learn a domain agnostic feature representation. We perform extensive evaluation with both one-stage (FCOS, YOLO) and two-stage (FRCNN) detectors, on a newly proposed benchmark comprising several different datasets for autonomous driving applications (Cityscapes, BDD10K, ACDC, IDD) as well as the GWHD dataset for precision agriculture, and show consistent improvements to the generalisation and localisation performance over baselines and state-of-the-art.

arxiv情報

著者 Karthik Seemakurthy,Erchan Aptoula,Charles Fox,Petra Bosilj
発行日 2024-05-13 15:23:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク