TGDM: Target Guided Dynamic Mixup for Cross-Domain Few-Shot Learning

要約

ソース ドメインで十分なトレーニング データが与えられた場合、クロスドメイン フューズ ショット学習 (CD-FSL) は、ターゲット ドメインで少数のラベル付きの例を使用して新しいクラスを認識することを目的としています。
CD-FSL に対処するための鍵は、ドメイン ギャップを狭め、ソース ドメインでトレーニングされたネットワークの知識をターゲット ドメインに移すことです。
知識の伝達を支援するために、このホワイト ペーパーでは、ソース ドメインとターゲット ドメインのイメージを混合することによって生成される中間ドメインを紹介します。
具体的には、さまざまなターゲットデータに最適な中間ドメインを生成するために、ターゲットデータを活用して動的ミックスアップを介して混合画像の生成をガイドする、新しいターゲット誘導動的ミックスアップ (TGDM) フレームワークを提案します。
提案された TGDM フレームワークには、分類子を学習するための Mixup-3T ネットワークと、最適な混合比を学習するための動的比率生成ネットワーク (DRGN) が含まれています。
知識をより適切に伝達するために、提案された Mixup-3T ネットワークには、ソース ドメイン、ターゲット ドメイン、および中間ドメインでクラスを分類するための共有パラメーターを持つ 3 つのブランチが含まれています。
最適な中間ドメインを生成するために、DRGN は補助ターゲット データのパフォーマンスに応じて最適な混合比を生成することを学習します。
次に、TGDM フレームワーク全体が 2 レベルのメタ学習によってトレーニングされるため、TGDM はそれ自体を修正して、ターゲット データで最適なパフォーマンスを達成できます。
いくつかのベンチマーク データセットに関する広範な実験結果により、この方法の有効性が検証されます。

要約(オリジナル)

Given sufficient training data on the source domain, cross-domain few-shot learning (CD-FSL) aims at recognizing new classes with a small number of labeled examples on the target domain. The key to addressing CD-FSL is to narrow the domain gap and transferring knowledge of a network trained on the source domain to the target domain. To help knowledge transfer, this paper introduces an intermediate domain generated by mixing images in the source and the target domain. Specifically, to generate the optimal intermediate domain for different target data, we propose a novel target guided dynamic mixup (TGDM) framework that leverages the target data to guide the generation of mixed images via dynamic mixup. The proposed TGDM framework contains a Mixup-3T network for learning classifiers and a dynamic ratio generation network (DRGN) for learning the optimal mix ratio. To better transfer the knowledge, the proposed Mixup-3T network contains three branches with shared parameters for classifying classes in the source domain, target domain, and intermediate domain. To generate the optimal intermediate domain, the DRGN learns to generate an optimal mix ratio according to the performance on auxiliary target data. Then, the whole TGDM framework is trained via bi-level meta-learning so that TGDM can rectify itself to achieve optimal performance on target data. Extensive experimental results on several benchmark datasets verify the effectiveness of our method.

arxiv情報

著者 Linhai Zhuo,Yuqian Fu,Jingjing Chen,Yixin Cao,Yu-Gang Jiang
発行日 2022-11-30 14:21:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク