A Unified Contrastive Transfer Framework with Propagation Structure for Boosting Low-Resource Rumor Detection

要約

タイトル:低リソースのデマ検出を促進する伝搬構造付き一元的なコントラスティブ転移フレームワーク

要約:

– デマが大量に広がるため真実発言を特定することが困難である。
– 既存のデマ検出アルゴリズムは、昨日のニュースのように同じドメインからデータが揃っている場合は良好な性能を示すが、データ不足や事前のエキスパート知識がないと新しい出来事、特に異なる言語で広がったデマを特定するのは困難である。
– 提案されたモデルは、少量の注釈情報を使用して高質なラベルを持つデータから習得した特徴を低リソースのデータに適応させ、異なる言語、ドメインの問題を克服する統一されたコントラスティブ転移フレームワークを提供する。
– ソーシャルメディア上で拡散されるデマを存在する環境から生成するため、ユーザーの意見の相互作用を強化するために、最初に非定向性トポロジーとして表現する。
– 参照となるドメインの特徴を低リソース情報に転移するために、多層のグラフ畳み込みネットワークをトレーニングする。
– 目標事象の分布の均一性がデマを示すことができるため、小さな目標イベントの注釈付けとともに表現学習を十分に汎化する。
– 低リソースのマイクロブログプラットフォームから収集された4つのデータセット上で実験を行い、提案されたフレームワークは最先端の方法より優れた性能を発揮し、デマを早期に検出する能力に優れていることが示された。

要約(オリジナル)

The truth is significantly hampered by massive rumors that spread along with breaking news or popular topics. Since there is sufficient corpus gathered from the same domain for model training, existing rumor detection algorithms show promising performance on yesterday’s news. However, due to a lack of substantial training data and prior expert knowledge, they are poor at spotting rumors concerning unforeseen events, especially those propagated in different languages (i.e., low-resource regimes). In this paper, we propose a unified contrastive transfer framework to detect rumors by adapting the features learned from well-resourced rumor data to that of the low-resourced with only few-shot annotations. More specifically, we first represent rumor circulated on social media as an undirected topology for enhancing the interaction of user opinions, and then train a Multi-scale Graph Convolutional Network via a unified contrastive paradigm to mine effective clues simultaneously from post semantics and propagation structure. Our model explicitly breaks the barriers of the domain and/or language issues, via language alignment and a novel domain-adaptive contrastive learning mechanism. To well-generalize the representation learning using a small set of annotated target events, we reveal that rumor-indicative signal is closely correlated with the uniformity of the distribution of these events. We design a target-wise contrastive training mechanism with three event-level data augmentation strategies, capable of unifying the representations by distinguishing target events. Extensive experiments conducted on four low-resource datasets collected from real-world microblog platforms demonstrate that our framework achieves much better performance than state-of-the-art methods and exhibits a superior capacity for detecting rumors at early stages.

arxiv情報

著者 Hongzhan Lin,Jing Ma,Ruichao Yang,Zhiwei Yang,Mingfei Cheng
発行日 2023-04-09 13:23:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク