Multi-Source Domain Adaptation for Object Detection with Prototype-based Mean-teacher

要約

視覚オブジェクト検出器を操作上のターゲット ドメインに適応させるのは困難な作業であり、通常は教師なしドメイン適応 (UDA) 手法を使用して達成されます。
ラベル付きデータセットが複数のソース ドメインから取得されている場合、MSDA の最近の研究で観察されているように、それらを個別のドメインとして扱い、マルチソース ドメイン アダプテーション (MSDA) を実行すると、これらのソース ドメインを混合して UDA を実行するよりも精度と堅牢性が向上します。
既存の MSDA メソッドは、適応のためにドメイン不変パラメータとドメイン固有パラメータ (ソース ドメインごとに) を学習します。
ただし、単一ソースの UDA メソッドとは異なり、ドメイン固有のパラメーターを学習すると、使用されるソース ドメインの数に比例してパラメータが大幅に増加します。
この論文では、ドメイン固有のサブネットの代わりにクラス プロトタイプを使用してドメイン固有の情報を保存する、プロトタイプベースの平均教師 (PMT) と呼ばれる新しい MSDA メソッドを提案します。
これらのプロトタイプは、対照的な損失を使用して学習され、ドメイン間で同じカテゴリを整列させ、異なるカテゴリを遠くに分離します。
プロトタイプを使用するため、ソース ドメインの数に応じてメソッドのパラメーター サイズが大幅に増加することはなく、メモリの問題やオーバーフィッティングの可能性が軽減されます。
実証研究では、PMT がいくつかの困難な物体検出データセットにおいて最先端の MSDA 手法よりも優れたパフォーマンスを発揮することが示されています。

要約(オリジナル)

Adapting visual object detectors to operational target domains is a challenging task, commonly achieved using unsupervised domain adaptation (UDA) methods. When the labeled dataset is coming from multiple source domains, treating them as separate domains and performing a multi-source domain adaptation (MSDA) improves the accuracy and robustness over mixing these source domains and performing a UDA, as observed by recent studies in MSDA. Existing MSDA methods learn domain invariant and domain-specific parameters (for each source domain) for the adaptation. However, unlike single-source UDA methods, learning domain-specific parameters makes them grow significantly proportional to the number of source domains used. This paper proposes a novel MSDA method called Prototype-based Mean-Teacher (PMT), which uses class prototypes instead of domain-specific subnets to preserve domain-specific information. These prototypes are learned using a contrastive loss, aligning the same categories across domains and separating different categories far apart. Because of the use of prototypes, the parameter size of our method does not increase significantly with the number of source domains, thus reducing memory issues and possible overfitting. Empirical studies show PMT outperforms state-of-the-art MSDA methods on several challenging object detection datasets.

arxiv情報

著者 Atif Belal,Akhil Meethal,Francisco Perdigon Romero,Marco Pedersoli,Eric Granger
発行日 2023-09-26 14:08:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク