Design and analysis of tweet-based election models for the 2021 Mexican legislative election

要約

オンライン ソーシャル メディアを使用して現実の人間の行動をモデル化し、予測することは、政治、政府、学術界、業界の関心を集めている積極的な取り組みです。
Twitter は 2006 年の創設以来、社会的行動を測定および予測するために使用できる潜在的な実験室として提案されてきました。
過去 10 年間で、Twitter のユーザー ベースは拡大し、一般人口をより代表するものになりました。
ここでは、2021 年のメキシコ議会選挙に関連してこのユーザー ベースを分析します。
そのために、選挙日前 6 か月間の 1,500 万件の選挙関連ツイートのデータセットを使用します。
私たちは、与党または野党のいずれかに政治的優先順位を割り当てるさまざまな選挙モデルを検討します。
地理的属性を持つデータを使用したモデルは、従来の投票方法よりも優れた精度と正確さで選挙結果を決定することがわかりました。
これらの結果は、公開オンライン データの分析が従来の世論調査方法よりも優れたパフォーマンスを発揮できること、および近い将来、政治分析や一般的な予測がそのようなデータを組み込むことで恩恵を受ける可能性があることを示しています。
さらに、地理的属性を含む同じ Twitter データセットは、メキシコの人口とインターネット利用に関する公式国勢調査データの結果と正の相関関係があります。
これらの調査結果は、オンラインでの活動が適切に管理され、オフラインでの行動を正確に表現できる時代に到達したことを示唆しています。

要約(オリジナル)

Modelling and forecasting real-life human behaviour using online social media is an active endeavour of interest in politics, government, academia, and industry. Since its creation in 2006, Twitter has been proposed as a potential laboratory that could be used to gauge and predict social behaviour. During the last decade, the user base of Twitter has been growing and becoming more representative of the general population. Here we analyse this user base in the context of the 2021 Mexican Legislative Election. To do so, we use a dataset of 15 million election-related tweets in the six months preceding election day. We explore different election models that assign political preference to either the ruling parties or the opposition. We find that models using data with geographical attributes determine the results of the election with better precision and accuracy than conventional polling methods. These results demonstrate that analysis of public online data can outperform conventional polling methods, and that political analysis and general forecasting would likely benefit from incorporating such data in the immediate future. Moreover, the same Twitter dataset with geographical attributes is positively correlated with results from official census data on population and internet usage in Mexico. These findings suggest that we have reached a period in time when online activity, appropriately curated, can provide an accurate representation of offline behaviour.

arxiv情報

著者 Alejandro Vigna-Gómez,Javier Murillo,Manelik Ramirez,Alberto Borbolla,Ian Márquez,Prasun K. Ray
発行日 2023-06-21 08:01:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SI パーマリンク