Overcoming Data Inequality across Domains with Semi-Supervised Domain Generalization

要約

広範なデータセットによって機械学習は大幅に進歩しましたが、さまざまなソースや集団にわたるデータの利用可能性には依然として大きな格差が残っています。
ドメイン間のこの不平等は、データが限られている人々のモデリングに課題をもたらし、現実的かつ倫理的な深刻な懸念につながる可能性があります。
この論文では、半教師ありドメイン一般化 (SSDG) と呼ばれる、ドメイン間のデータ不平等問題の代表的なケースについて取り上げます。このケースでは、1 つのドメインのみにラベルが付けられ、残りのドメインにはラベルが付けられていません。
我々は、ラベル付きドメインとラベルなしドメインの不確実性適応混合による漸進的一般化とともに、ドメインを認識したプロトタイプを介してドメイン不変の特徴を効果的に学習できる新しいアルゴリズム ProUD を提案します。
3 つの異なるベンチマーク データセットでの実験では、ProUD の有効性が実証され、単一ドメインの一般化や半教師あり学習を含むすべてのベースライン モデルを上回っています。
ソースコードは論文が受理され次第公開されます。

要約(オリジナル)

While there have been considerable advancements in machine learning driven by extensive datasets, a significant disparity still persists in the availability of data across various sources and populations. This inequality across domains poses challenges in modeling for those with limited data, which can lead to profound practical and ethical concerns. In this paper, we address a representative case of data inequality problem across domains termed Semi-Supervised Domain Generalization (SSDG), in which only one domain is labeled while the rest are unlabeled. We propose a novel algorithm, ProUD, which can effectively learn domain-invariant features via domain-aware prototypes along with progressive generalization via uncertainty-adaptive mixing of labeled and unlabeled domains. Our experiments on three different benchmark datasets demonstrate the effectiveness of ProUD, outperforming all baseline models including single domain generalization and semi-supervised learning. Source code will be released upon acceptance of the paper.

arxiv情報

著者 Jinha Park,Wonguk Cho,Taesup Kim
発行日 2024-03-08 10:49:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク