Improving Transferability of Domain Adaptation Networks Through Domain Alignment Layers

要約

ディープ ラーニング (DL) は、多くのタスクで関連する結果が得られるため、さまざまなコンピューター ビジョン タスクで使用される主要なアプローチです。
ただし、ラベル付けされたデータが部分的またはまったくない現実のシナリオでは、DL メソッドもよく知られているドメイン シフトの問題を起こしやすくなります。
マルチソースの教師なしドメイン適応 (MSDA) は、ソース モデルのバッグから弱い知識を割り当てることによって、ラベルのないドメインの予測子を学習することを目的としています。
ただし、ほとんどの作品は、抽出された特徴のみを活用し、損失関数設計の観点からドメインシフトを減らすドメイン適応を行っています。
このホワイト ペーパーでは、ドメイン レベルの機能のみに基づいてドメイン シフトを処理するだけでは不十分であると主張しますが、そのような情報を機能空間で整列させることも不可欠です。
以前の作業とは異なり、ネットワーク設計に焦点を当て、予測子のさまざまなレベルで DomaIn アライメント レイヤー (MS-DIAL) のマルチソース バージョンを埋め込むことを提案します。
これらのレイヤーは、異なるドメイン間の機能分布に一致するように設計されており、さまざまな MSDA メソッドに簡単に適用できます。
私たちのアプローチの堅牢性を示すために、数字認識とオブジェクト分類という 2 つの困難なシナリオを考慮して、広範な実験的評価を実施しました。
実験結果は、私たちのアプローチが最先端の MSDA メソッドを改善し、分類精度で最大 +30.64% の相対ゲインをもたらすことを示しました。

要約(オリジナル)

Deep learning (DL) has been the primary approach used in various computer vision tasks due to its relevant results achieved on many tasks. However, on real-world scenarios with partially or no labeled data, DL methods are also prone to the well-known domain shift problem. Multi-source unsupervised domain adaptation (MSDA) aims at learning a predictor for an unlabeled domain by assigning weak knowledge from a bag of source models. However, most works conduct domain adaptation leveraging only the extracted features and reducing their domain shift from the perspective of loss function designs. In this paper, we argue that it is not sufficient to handle domain shift only based on domain-level features, but it is also essential to align such information on the feature space. Unlike previous works, we focus on the network design and propose to embed Multi-Source version of DomaIn Alignment Layers (MS-DIAL) at different levels of the predictor. These layers are designed to match the feature distributions between different domains and can be easily applied to various MSDA methods. To show the robustness of our approach, we conducted an extensive experimental evaluation considering two challenging scenarios: digit recognition and object classification. The experimental results indicated that our approach can improve state-of-the-art MSDA methods, yielding relative gains of up to +30.64% on their classification accuracies.

arxiv情報

著者 Lucas Fernando Alvarenga e Silva,Daniel Carlos Guimarães Pedronette,Fábio Augusto Faria,João Paulo Papa,Jurandy Almeida
発行日 2022-08-24 14:07:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク