要約
教師なし領域適応(UDA)は、2つのデータ分布間の領域のずれを軽減することを目的とした一般的な手法である。これはコンピュータビジョンや自然言語処理においてうまく適用されている。本研究では、フェイクニュースと超党派ニュースの検出という2つのテキスト分類タスクの間で、様々な教師なしドメイン適応技術の効果を探索する。我々は、フェイクニュース検出から超党派ニュース検出への知識伝達を、学習時にターゲットラベルを介さずに調査する。そのため、UDA、教師によるクラスタ整列、領域横断的な対照学習を評価する。広範な実験により、これらの手法がパフォーマンスを向上させ、データ補強を含めることで結果がさらに向上することが示された。さらに、クラスタリングとトピックモデリングアルゴリズムをUDAと組み合わせることで、最初のUDA設定と比較して性能が向上する。
要約(オリジナル)
Unsupervised Domain Adaptation (UDA) is a popular technique that aims to reduce the domain shift between two data distributions. It was successfully applied in computer vision and natural language processing. In the current work, we explore the effects of various unsupervised domain adaptation techniques between two text classification tasks: fake and hyperpartisan news detection. We investigate the knowledge transfer from fake to hyperpartisan news detection without involving target labels during training. Thus, we evaluate UDA, cluster alignment with a teacher, and cross-domain contrastive learning. Extensive experiments show that these techniques improve performance, while including data augmentation further enhances the results. In addition, we combine clustering and topic modeling algorithms with UDA, resulting in improved performances compared to the initial UDA setup.
arxiv情報
著者 | Răzvan-Alexandru Smădu,Sebastian-Vasile Echim,Dumitru-Clementin Cercel,Iuliana Marin,Florin Pop |
発行日 | 2023-08-04 07:58:48+00:00 |
arxivサイト | arxiv_id(pdf) |