Factify 2: A Multimodal Fake News and Satire News Dataset

要約

タイトル:Factify 2:マルチモーダルフェイクニュースと風刺ニュースのデータセット
要約:
– インターネットは、人々が自分たちの見解を表明し、物語を共有するためのオープンで貴重なプラットフォームを提供しています。
– これは非常に価値があるが、フェイクニュースは私たちの社会で最も深刻な問題の1つとなっています。手動の事実確認プロセスは時間がかかり、誤解を招く主張を否定することが困難になっています。
– これに対する自動的な事実または主張の検証に関心が高まっている。既存のいくつかのデータセットは自動事実確認技術の開発を支援することを目的としていますが、大部分はテキストベースです。マルチモーダル事実検証は比較的注目されています。
– この論文では、新しいデータソースを使用し、風刺記事を追加することでFactify 1を改善した、マルチモーダル事実確認データセットであるFACTIFY 2を提供します。Factify 2には50,000の新しいデータが含まれています。
– Factify 1.0と同様に、視覚的およびテキストデータの論理構造に基づいて、サポート、無証拠、反証の3つの広範なカテゴリがあります。
– 加えて、BERTとVision Transformerに基づくベースラインを提供し、テストセットで65%のF1スコアを達成しています。
– ベースラインのコードとデータセットは、https://github.com/surya1701/Factify-2.0で公開されます。

要約(オリジナル)

The internet gives the world an open platform to express their views and share their stories. While this is very valuable, it makes fake news one of our society’s most pressing problems. Manual fact checking process is time consuming, which makes it challenging to disprove misleading assertions before they cause significant harm. This is he driving interest in automatic fact or claim verification. Some of the existing datasets aim to support development of automating fact-checking techniques, however, most of them are text based. Multi-modal fact verification has received relatively scant attention. In this paper, we provide a multi-modal fact-checking dataset called FACTIFY 2, improving Factify 1 by using new data sources and adding satire articles. Factify 2 has 50,000 new data instances. Similar to FACTIFY 1.0, we have three broad categories – support, no-evidence, and refute, with sub-categories based on the entailment of visual and textual data. We also provide a BERT and Vison Transformer based baseline, which acheives 65% F1 score in the test set. The baseline codes and the dataset will be made available at https://github.com/surya1701/Factify-2.0.

arxiv情報

著者 S Suryavardan,Shreyash Mishra,Parth Patwa,Megha Chakraborty,Anku Rani,Aishwarya Reganti,Aman Chadha,Amitava Das,Amit Sheth,Manoj Chinnakotla,Asif Ekbal,Srijan Kumar
発行日 2023-04-08 03:14:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.CV パーマリンク