Learning Domain-Invariant Features for Out-of-Context News Detection

要約

文脈を無視したニュースは、オンライン メディア プラットフォームでよく見られるタイプの誤った情報です。
これには、一致しないニュース画像と一緒にキャプションを投稿することが含まれます。
既存のコンテキストを逸脱したニュース検出モデルは、各ドメインで事前にラベル付けされたデータが利用可能なシナリオのみを考慮しており、ラベルのないドメイン (ニュース トピックや代理店など) でのコンテキストを逸脱したニュースの検出に対処できません。
したがって、この研究では、ドメイン適応型アウトオブコンテキスト ニュース検出に焦点を当てます。
検出モデルをラベルのないニューストピックやエージェンシーに効果的に適応させるために、コントラスト学習と最大平均不一致 (MMD) を適用してドメイン不変の特徴を学習する ConDA-TTA (Contrastive Domain Adaptation with Test-Time Adaptation) を提案します。
さらに、テスト時のターゲット ドメイン統計を活用して、ドメインの適応をさらに支援します。
実験結果は、私たちのアプローチが 2 つの公開データセット上のほとんどのドメイン適応設定でベースラインを上回り、F1 で 2.93%、精度で 2.08% も優れていることを示しています。

要約(オリジナル)

Out-of-context news is a common type of misinformation on online media platforms. This involves posting a caption, alongside a mismatched news image. Existing out-of-context news detection models only consider the scenario where pre-labeled data is available for each domain, failing to address the out-of-context news detection on unlabeled domains (e.g. news topics or agencies). In this work, we therefore focus on domain adaptive out-of-context news detection. In order to effectively adapt the detection model to unlabeled news topics or agencies, we propose ConDA-TTA (Contrastive Domain Adaptation with Test-Time Adaptation) which applies contrastive learning and maximum mean discrepancy (MMD) to learn domain-invariant features. In addition, we leverage test-time target domain statistics to further assist domain adaptation. Experimental results show that our approach outperforms baselines in most domain adaptation settings on two public datasets, by as much as 2.93% in F1 and 2.08% in accuracy.

arxiv情報

著者 Yimeng Gu,Mengqi Zhang,Ignacio Castro,Shu Wu,Gareth Tyson
発行日 2024-08-08 07:34:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.MM パーマリンク