Divide and Adapt: Active Domain Adaptation via Customized Learning


アクティブ ドメイン アダプテーション (ADA) は、アクティブ ラーニング (AL) 手法を組み込んで、ターゲット サンプルの最大限の情報を含むサブセットにラベルを付けることで、モデルの適応パフォーマンスを向上させることを目的としています。
従来の AL 手法ではドメイン シフトの存在が考慮されていないため、ドメイン適応の観点から真に価値のあるサンプルを特定できません。
アクティブ ラーニングとドメイン適応という 2 つの本来異なるタスクに協調的なフレームワークで対応するために、ターゲット データに合わせてカスタマイズされた学習戦略が ADA ソリューションの成功の鍵であると主張します。
ターゲット インスタンスを階層化された譲渡可能なプロパティを持つ 4 つのカテゴリに分割する新しい ADA フレームワークである Divide-and-Adapt (DiaNA) を紹介します。
DiaNA は、不確実性とドメイン性に基づいた新しいデータ細分プロトコルを使用して、最も有益なサンプルを正確に認識できます。
注釈用の情報インスタンスを送信する際、DiaNA は残りのカテゴリに合わせた学習戦略を採用します。
これにより、混合ガウス モデル (GMM) を使用して、ラベルのないデータを提案された 4 つのカテゴリに自動的にサンプリングできるようになります。
「分割と適応」の精神のおかげで、DiaNA はドメイン ギャップが大きく変化するデータを処理できます。
さらに、DiaNA が教師なしドメイン アダプテーション (UDA)、半教師ありドメイン アダプテーション (SSDA)、ソースフリー ドメイン アダプテーション (SFDA) などのさまざまなドメイン アダプテーション設定に一般化できることを示します。


Active domain adaptation (ADA) aims to improve the model adaptation performance by incorporating active learning (AL) techniques to label a maximally-informative subset of target samples. Conventional AL methods do not consider the existence of domain shift, and hence, fail to identify the truly valuable samples in the context of domain adaptation. To accommodate active learning and domain adaption, the two naturally different tasks, in a collaborative framework, we advocate that a customized learning strategy for the target data is the key to the success of ADA solutions. We present Divide-and-Adapt (DiaNA), a new ADA framework that partitions the target instances into four categories with stratified transferable properties. With a novel data subdivision protocol based on uncertainty and domainness, DiaNA can accurately recognize the most gainful samples. While sending the informative instances for annotation, DiaNA employs tailored learning strategies for the remaining categories. Furthermore, we propose an informativeness score that unifies the data partitioning criteria. This enables the use of a Gaussian mixture model (GMM) to automatically sample unlabeled data into the proposed four categories. Thanks to the ‘divideand-adapt’ spirit, DiaNA can handle data with large variations of domain gap. In addition, we show that DiaNA can generalize to different domain adaptation settings, such as unsupervised domain adaptation (UDA), semi-supervised domain adaptation (SSDA), source-free domain adaptation (SFDA), etc.


著者 Duojun Huang,Jichang Li,Weikai Chen,Junshi Huang,Zhenhua Chai,Guanbin Li
発行日 2023-07-21 14:37:17+00:00
arxivサイト arxiv_id(pdf)

