HiGDA: Hierarchical Graph of Nodes to Learn Local-to-Global Topology for Semi-Supervised Domain Adaptation

要約

深層学習モデルの表現力の強化と幅広い適用性は、近年、研究コミュニティから大きな関心を集めています。
ただし、これらのモデルは、トレーニング データ (ソース ドメイン) は関連しているものの、テスト データ (ターゲット ドメイン) とは異なる分布を示すドメイン シフト条件下では効果的に実行するのが難しいことがよくあります。
この課題に対処するために、これまでの研究では、トレーニング中にいくつかのラベル付きターゲット サンプルを組み込むことによって、ソース データとターゲット データの間のドメイン ギャップを減らすことが試みられました。これは、半教師ありドメイン アダプテーション (SSDA) として知られる技術です。
この戦略は分類パフォーマンスの顕著な向上を示していますが、これらのアプローチで使用されるネットワーク アーキテクチャは主に個々の画像の特徴を活用することに焦点を当てており、豊かな表現のキャプチャには改善の余地が残されています。
この研究では、特徴レベルとカテゴリ レベルの両方で表現を同時に表示するように設計されたノードの階層グラフを導入します。
特徴レベルでは、画像内で最も関連性の高いパッチを特定するローカル グラフを導入し、定義された主要オブジェクト表現への適応を容易にします。
カテゴリ レベルでは、グローバル グラフを使用して同じカテゴリ内のサンプルの特徴を集約し、それによって全体的な表現を強化します。
Office-Home、DomainNet、VisDA2017 など、広く使用されている SSDA ベンチマーク データセットに対する広範な実験により、定量的結果と定性的結果の両方で HiGDA の有効性が実証され、HiGDA が新しい最先端の手法として確立されています。

要約(オリジナル)

The enhanced representational power and broad applicability of deep learning models have attracted significant interest from the research community in recent years. However, these models often struggle to perform effectively under domain shift conditions, where the training data (the source domain) is related to but exhibits different distributions from the testing data (the target domain). To address this challenge, previous studies have attempted to reduce the domain gap between source and target data by incorporating a few labeled target samples during training – a technique known as semi-supervised domain adaptation (SSDA). While this strategy has demonstrated notable improvements in classification performance, the network architectures used in these approaches primarily focus on exploiting the features of individual images, leaving room for improvement in capturing rich representations. In this study, we introduce a Hierarchical Graph of Nodes designed to simultaneously present representations at both feature and category levels. At the feature level, we introduce a local graph to identify the most relevant patches within an image, facilitating adaptability to defined main object representations. At the category level, we employ a global graph to aggregate the features from samples within the same category, thereby enriching overall representations. Extensive experiments on widely used SSDA benchmark datasets, including Office-Home, DomainNet, and VisDA2017, demonstrate that both quantitative and qualitative results substantiate the effectiveness of HiGDA, establishing it as a new state-of-the-art method.

arxiv情報

著者 Ba Hung Ngo,Doanh C. Bui,Nhat-Tuong Do-Tran,Tae Jong Choi
発行日 2024-12-16 14:35:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク