Instance Relation Graph Guided Source-Free Domain Adaptive Object Detection

要約

教師なしドメイン適応 (UDA) は、ドメイン シフトの問題に取り組むための効果的なアプローチです。
具体的には、UDA メソッドは、ソースとターゲットの表現を揃えて、ターゲット ドメインでの一般化を改善しようとします。
さらに、UDA メソッドは、適応プロセス中にソース データにアクセスできるという前提の下で機能します。
ただし、実際のシナリオでは、ラベル付けされたソース データは、多くの場合、プライバシー規制、データ転送の制約、または独自のデータに関する懸念により制限されています。
Source-Free Domain Adaptation (SFDA) 設定は、ソース データへのアクセスを必要とせずに、ソースでトレーニングされたモデルをターゲット ドメインに適応させることで、これらの問題を軽減することを目的としています。
このホワイト ペーパーでは、適応型オブジェクト検出タスクの SFDA 設定について説明します。
この目的のために、ソースデータなしでソーストレーニングされたオブジェクト検出器をターゲットドメインに適応させるための新しいトレーニング戦略を提案します。
より正確には、特定のターゲットドメイン入力のオブジェクト関係を利用することにより、ターゲット表現を強化するための新しいコントラスト損失を設計します。
これらのオブジェクト インスタンスの関係は、Instance Relation Graph (IRG) ネットワークを使用してモデル化され、対照表現の学習を導くために使用されます。
さらに、ソーストレーニングされたモデルによって生成されたノイズの多い疑似ラベルへの過剰適合を避けるために、学生と教師に基づく知識蒸留戦略を利用しています。
複数のオブジェクト検出ベンチマーク データセットに関する広範な実験は、提案されたアプローチが、ソースでトレーニングされたオブジェクト検出器をターゲット ドメインに効率的に適応させ、以前の最先端のドメイン適応検出方法よりも優れていることを示しています。
コードとモデルは \href{https://viudomain.github.io/irg-sfda-web/}{https://viudomain.github.io/irg-sfda-web/} で提供されています。

要約(オリジナル)

Unsupervised Domain Adaptation (UDA) is an effective approach to tackle the issue of domain shift. Specifically, UDA methods try to align the source and target representations to improve the generalization on the target domain. Further, UDA methods work under the assumption that the source data is accessible during the adaptation process. However, in real-world scenarios, the labelled source data is often restricted due to privacy regulations, data transmission constraints, or proprietary data concerns. The Source-Free Domain Adaptation (SFDA) setting aims to alleviate these concerns by adapting a source-trained model for the target domain without requiring access to the source data. In this paper, we explore the SFDA setting for the task of adaptive object detection. To this end, we propose a novel training strategy for adapting a source-trained object detector to the target domain without source data. More precisely, we design a novel contrastive loss to enhance the target representations by exploiting the objects relations for a given target domain input. These object instance relations are modelled using an Instance Relation Graph (IRG) network, which are then used to guide the contrastive representation learning. In addition, we utilize a student-teacher based knowledge distillation strategy to avoid overfitting to the noisy pseudo-labels generated by the source-trained model. Extensive experiments on multiple object detection benchmark datasets show that the proposed approach is able to efficiently adapt source-trained object detectors to the target domain, outperforming previous state-of-the-art domain adaptive detection methods. Code and models are provided in \href{https://viudomain.github.io/irg-sfda-web/}{https://viudomain.github.io/irg-sfda-web/}.

arxiv情報

著者 Vibashan VS,Poojan Oza,Vishal M. Patel
発行日 2023-03-21 16:06:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク