要約
分布外 (OOD) データへの一般化は、人間にとっては自然な機能ですが、マシンが再現するのは困難です。
これは、ほとんどの学習アルゴリズムが、ソース/ターゲット データの i.i.d.~仮定に強く依存しているためです。これは、実際にはドメイン シフトによりしばしば違反されます。
ドメイン一般化 (DG) は、モデル学習にソース データのみを使用して OOD 一般化を実現することを目的としています。
過去 10 年間で、DG の研究は大きな進歩を遂げ、ドメイン アラインメント、メタ学習、データ拡張、またはアンサンブル学習に基づくものなど、幅広い方法論が生まれました。
DG は、コンピューター ビジョン、音声認識、自然言語処理、医療画像処理、強化学習など、さまざまな応用分野でも研究されています。
この論文では、過去 10 年間の展開を要約するために、初めて DG の包括的な文献レビューが提供されます。
具体的には、最初にDGを正式に定義し、それをドメイン適応や転移学習などの他の関連分野に関連付けることにより、背景をカバーします。
そして、既存の手法や理論を徹底的に見直します。
最後に、今後の研究の方向性についての洞察と議論でこの調査を締めくくります。
要約(オリジナル)
Generalization to out-of-distribution (OOD) data is a capability natural to humans yet challenging for machines to reproduce. This is because most learning algorithms strongly rely on the i.i.d.~assumption on source/target data, which is often violated in practice due to domain shift. Domain generalization (DG) aims to achieve OOD generalization by using only source data for model learning. Over the last ten years, research in DG has made great progress, leading to a broad spectrum of methodologies, e.g., those based on domain alignment, meta-learning, data augmentation, or ensemble learning, to name a few; DG has also been studied in various application areas including computer vision, speech recognition, natural language processing, medical imaging, and reinforcement learning. In this paper, for the first time a comprehensive literature review in DG is provided to summarize the developments over the past decade. Specifically, we first cover the background by formally defining DG and relating it to other relevant fields like domain adaptation and transfer learning. Then, we conduct a thorough review into existing methods and theories. Finally, we conclude this survey with insights and discussions on future research directions.
arxiv情報
著者 | Kaiyang Zhou,Ziwei Liu,Yu Qiao,Tao Xiang,Chen Change Loy |
発行日 | 2022-08-12 08:24:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google