Lost in Translation — Multilingual Misinformation and its Evolution

要約

デジタル時代において誤った情報や偽情報の脅威は増大しており、言語や国境を越えて急速に拡散しています。
この論文では、95 言語にわたる 250,000 を超える独自のファクトチェックの分析を通じて、多言語の誤った情報の蔓延とダイナミクスを調査しています。
まず、誤報の主張の大部分は事実確認が 1 回だけであるのに対し、21,000 件以上の主張に相当する 11.7% は複数回確認されていることがわかりました。
誤った情報の拡散の代​​用としてファクトチェックを使用すると、繰り返される主張の 33% が言語の境界を越えていることがわかり、一部の誤った情報が言語の壁を越えて浸透していることが示唆されています。
ただし、拡散パターンは強い同性愛性を示しており、誤った情報は同じ言語内で拡散する可能性が高くなります。
時間の経過に伴うクレームの進化と言語間の変異を研究するために、多言語文の埋め込みを使用してファクトチェックを表し、意味的に類似したクレームをクラスター化します。
私たちは、クレームの異なるバージョンを接続する接続されたコンポーネントと最短パスを分析し、クレームは時間の経過とともに徐々にドリフトし、言語を横断する際にさらに大きな変更を受けることが判明しました。
全体として、多言語の誤った情報に関するこの新しい調査は重要な洞察を提供します。
それは、冗長な事実確認の取り組みを定量化し、一部の主張が言語間で拡散していることを確立し、言語的同質性を測定し、主張の時間的および言語間進化をモデル化します。
この調査結果は、ローカライズされた検証の重要性を強調しながら、世界中のファクトチェッカー間で情報共有を拡大することを提唱しています。

要約(オリジナル)

Misinformation and disinformation are growing threats in the digital age, spreading rapidly across languages and borders. This paper investigates the prevalence and dynamics of multilingual misinformation through an analysis of over 250,000 unique fact-checks spanning 95 languages. First, we find that while the majority of misinformation claims are only fact-checked once, 11.7%, corresponding to more than 21,000 claims, are checked multiple times. Using fact-checks as a proxy for the spread of misinformation, we find 33% of repeated claims cross linguistic boundaries, suggesting that some misinformation permeates language barriers. However, spreading patterns exhibit strong homophily, with misinformation more likely to spread within the same language. To study the evolution of claims over time and mutations across languages, we represent fact-checks with multilingual sentence embeddings and cluster semantically similar claims. We analyze the connected components and shortest paths connecting different versions of a claim finding that claims gradually drift over time and undergo greater alteration when traversing languages. Overall, this novel investigation of multilingual misinformation provides key insights. It quantifies redundant fact-checking efforts, establishes that some claims diffuse across languages, measures linguistic homophily, and models the temporal and cross-lingual evolution of claims. The findings advocate for expanded information sharing between fact-checkers globally while underscoring the importance of localized verification.

arxiv情報

著者 Dorian Quelle,Calvin Cheng,Alexandre Bovet,Scott A. Hale
発行日 2023-10-27 12:21:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SI パーマリンク