要約
オンライン プラットフォーム上での誤った情報の拡散の増加により、自動化されたファクト チェックは過去数十年にわたって大きな注目を集めてきました。
これは、(i) 検証が必要なクレームを構成するオンライン プラットフォーム内で流通している文章の検出と、それに続く (ii) それらのクレームの検証プロセスからなる一連のタスクとして実行されることがよくあります。
この調査は前者に焦点を当てており、事実確認が必要な主張を検出するための既存の取り組みについて議論し、特に多言語データと手法に焦点を当てています。
これは挑戦的で豊饒な方向性であり、問題の本質が非常に難しいため、既存の方法ではまだ人間のパフォーマンスに匹敵するものには程遠いものです。
特に、複数の言語や手法で表現された複数のソーシャル プラットフォームにわたる情報の普及には、誤った情報と戦うためのより一般化されたソリューションが必要です。
多言語の誤情報に焦点を当て、既存の多言語クレーム検出研究の包括的な調査を紹介します。
最先端の多言語クレーム検出研究を、検証可能性、優先度、類似性という問題の 3 つの重要な要素に分類して紹介します。
さらに、既存の多言語データセットの詳細な概要を課題とともに示し、将来の進歩の可能性を示唆します。
要約(オリジナル)
Automated fact-checking has drawn considerable attention over the past few decades due to the increase in the diffusion of misinformation on online platforms. This is often carried out as a sequence of tasks comprising (i) the detection of sentences circulating in online platforms which constitute claims needing verification, followed by (ii) the verification process of those claims. This survey focuses on the former, by discussing existing efforts towards detecting claims needing fact-checking, with a particular focus on multilingual data and methods. This is a challenging and fertile direction where existing methods are yet far from matching human performance due to the profoundly challenging nature of the issue. Especially, the dissemination of information across multiple social platforms, articulated in multiple languages and modalities demands more generalized solutions for combating misinformation. Focusing on multilingual misinformation, we present a comprehensive survey of existing multilingual claim detection research. We present state-of-the-art multilingual claim detection research categorized into three key factors of the problem, verifiability, priority, and similarity. Further, we present a detailed overview of the existing multilingual datasets along with the challenges and suggest possible future advancements.
arxiv情報
著者 | Rrubaa Panchendrarajan,Arkaitz Zubiaga |
発行日 | 2024-01-22 14:17:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google