Learning Domain-Invariant Features for Out-of-Context News Detection


文脈を無視したニュースは、オンライン メディア プラットフォームでよく見られるタイプの誤った情報です。
既存のコンテキストを逸脱したニュース検出モデルは、各ドメインで事前にラベル付けされたデータが利用可能なシナリオのみを考慮しており、ラベルのないドメイン (ニュース トピックや代理店など) でのコンテキストを逸脱したニュースの検出に対処できません。
したがって、この研究では、ドメイン適応型アウトオブコンテキスト ニュース検出に焦点を当てます。
検出モデルをラベルのないニューストピックやエージェンシーに効果的に適応させるために、コントラスト学習と最大平均不一致 (MMD) を適用してドメイン不変の特徴を学習する ConDA-TTA (Contrastive Domain Adaptation with Test-Time Adaptation) を提案します。
さらに、テスト時のターゲット ドメイン統計を活用して、ドメインの適応をさらに支援します。
実験結果は、私たちのアプローチが 2 つの公開データセット上のほとんどのドメイン適応設定でベースラインを上回り、F1 で 2.93%、精度で 2.08% も優れていることを示しています。


Out-of-context news is a common type of misinformation on online media platforms. This involves posting a caption, alongside a mismatched news image. Existing out-of-context news detection models only consider the scenario where pre-labeled data is available for each domain, failing to address the out-of-context news detection on unlabeled domains (e.g. news topics or agencies). In this work, we therefore focus on domain adaptive out-of-context news detection. In order to effectively adapt the detection model to unlabeled news topics or agencies, we propose ConDA-TTA (Contrastive Domain Adaptation with Test-Time Adaptation) which applies contrastive learning and maximum mean discrepancy (MMD) to learn domain-invariant features. In addition, we leverage test-time target domain statistics to further assist domain adaptation. Experimental results show that our approach outperforms baselines in most domain adaptation settings on two public datasets, by as much as 2.93% in F1 and 2.08% in accuracy.


著者 Yimeng Gu,Mengqi Zhang,Ignacio Castro,Shu Wu,Gareth Tyson
発行日 2024-08-08 07:34:50+00:00
