A Unified Contrastive Transfer Framework with Propagation Structure for Boosting Low-Resource Rumor Detection

要約

タイトル:低リソースなデマ検出を促進する伝播構造と共に統一されたコントラスティブ転移フレームワーク

要約:

– デマは、急なニュースや人気のあるトピックに流布し、真実が大幅に妨げられる。従来のデマ検出アルゴリズムは、同じドメインから収集された十分なコーパスがあるため、昨日のニュースに関するデマ検出では有望な性能を示す。しかし、トレーニングデータや前提の専門知識が不足しているため、予想外のイベントに関連するデマ(特に異なる言語で伝播するもの:低リソース環境)を検出する際には不十分である。
– 本稿では、低リソースのものに適応するため、ウェルリソースのデマデータから学習された特徴を適応するための統一されたコントラスティブ転移フレームワークを提案する。具体的には、最初にソーシャルメディアで回転するデマを無向位相として表現し、その後、統一コントラスティブパラダイムを介してマルチスケールグラフ畳み込みネットワークをトレーニングする。私たちのモデルは、言語のアラインメントと新しいドメイン適応型コントラスティブ学習メカニズムを介してドメインと/または言語の問題の障害を明示的に壊す。小数のターゲットイベントからの表現学習を強化するために、ターゲットイベントの分布の均一性がデマを示すシグナルと密接に関連していることがわかりました。これらのイベントを区別することによって表現を統一することができる3つのデータ拡張戦略を持つターゲット別コントラスティブトレーニングメカニズムを設計しました。
– 実世界のマイクロブログプラットフォームから収集された4つの低リソースデータセットで実施された広範な実験の結果、私たちのフレームワークは、最先端の方法よりも優れた性能を発揮し、デマを早期に検出するための優れた能力を示す。

要約(オリジナル)

The truth is significantly hampered by massive rumors that spread along with breaking news or popular topics. Since there is sufficient corpus gathered from the same domain for model training, existing rumor detection algorithms show promising performance on yesterday’s news. However, due to a lack of training data and prior expert knowledge, they are poor at spotting rumors concerning unforeseen events, especially those propagated in different languages (i.e., low-resource regimes). In this paper, we propose a unified contrastive transfer framework to detect rumors by adapting the features learned from well-resourced rumor data to that of the low-resourced. More specifically, we first represent rumor circulated on social media as an undirected topology, and then train a Multi-scale Graph Convolutional Network via a unified contrastive paradigm. Our model explicitly breaks the barriers of the domain and/or language issues, via language alignment and a novel domain-adaptive contrastive learning mechanism. To enhance the representation learning from a small set of target events, we reveal that rumor-indicative signal is closely correlated with the uniformity of the distribution of these events. We design a target-wise contrastive training mechanism with three data augmentation strategies, capable of unifying the representations by distinguishing target events. Extensive experiments conducted on four low-resource datasets collected from real-world microblog platforms demonstrate that our framework achieves much better performance than state-of-the-art methods and exhibits a superior capacity for detecting rumors at early stages.

arxiv情報

著者 Hongzhan Lin,Jing Ma,Ruichao Yang,Zhiwei Yang,Mingfei Cheng
発行日 2023-04-04 03:13:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク