Europepolls: A Dataset of Country-Level Opinion Polling Data for the European Union and the UK

要約

私は、欧州連合と英国の国レベルの歴史的世論調査データのオープン データセットを提案します。
このデータセットは、欧州連合で利用可能な世論調査データのギャップを埋めることを目的としています。
一部の既存のデータセットは過去 5 年間に限定されており、研究の機会が制限されています。
同時に、大規模な独自のデータセットもいくつか存在しますが、それらは視覚的に前処理された時系列形式でのみ利用可能です。
最後に、個別の国に関する他の大規模なデータセットが存在する場合でも、言語の壁によりアクセスできない可能性があります。
データは Wikipedia から収集され、pandas ライブラリを使用して前処理されました。
生のデータと前処理されたデータは両方とも .csv 形式です。
LLM とディープ ラーニング全般の最近の進歩を考慮すると、この大規模なデータセットにより、研究者がマルチモーダル データ (ニュース記事、経済指標、ソーシャル メディア) と投票行動の間の複雑な相互作用を明らかにできるようになることを願っています。
生データ、前処理されたデータ、および前処理スクリプトは GitHub で入手できます。

要約(オリジナル)

I propose an open dataset of country-level historical opinion polling data for the European Union and the UK. The dataset aims to fill a gap in available opinion polling data for the European Union. Some existing datasets are restricted to the past five years, limiting research opportunities. At the same time, some larger proprietary datasets exist but are available only in a visual preprocessed time series format. Finally, while other large datasets for individual countries might exist, these could be inaccessible due to language barriers. The data was gathered from Wikipedia, and preprocessed using the pandas library. Both the raw and the preprocessed data are in the .csv format. I hope that given the recent advances in LLMs and deep learning in general, this large dataset will enable researchers to uncover complex interactions between multimodal data (news articles, economic indicators, social media) and voting behavior. The raw data, the preprocessed data, and the preprocessing scripts are available on GitHub.

arxiv情報

著者 Konstantinos Pitas
発行日 2023-07-19 15:05:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク