Combining the Strengths of Dutch Survey and Register Data in a Data Challenge to Predict Fertility (PreFer)

要約

社会科学は、出生の結果、つまり人々が子供を産むかどうか、またいつ子供を産むかについての決定要因について、印象的な一連の研究を生み出してきました。
ただし、これらの決定要因と基礎理論の強さが、新しいデータの予測能力によって評価されることはほとんどありません。
これにより、研究を体系的に比較することができなくなり、知識の評価と蓄積が妨げられます。
この論文では、オランダにおける出生率の予測可能性を研究するために使用できる 2 つのデータセットを紹介します。
1 つのデータセットは、個人の好みや価値観など、幅広いトピックに関する数千の変数を含む縦断的調査である LISS パネルに基づいています。
もう 1 つは、オランダの登録データに基づいたもので、態度データは欠如していますが、数百万のオランダ住民のライフ コースに関する詳細な情報が含まれています。
データセットとサンプルに関する情報を提供し、関心のある妊孕性の結果について説明します。
また、これらのデータセットに基づく、2024 年春に開始される出生予測データ チャレンジ PreFer についても紹介します。これらのデータセットを使用して出生予測データ チャレンジの予測可能性を測定し、データ チャレンジにおけるそれぞれの強みを組み合わせることで、妊娠に関する理解を進めることができる方法について概要を説明します。
生殖行動と計算社会科学。
さらに、データ チャレンジに参加する方法について参加者に詳細を提供します。

要約(オリジナル)

The social sciences have produced an impressive body of research on determinants of fertility outcomes, or whether and when people have children. However, the strength of these determinants and underlying theories are rarely evaluated on their predictive ability on new data. This prevents us from systematically comparing studies, hindering the evaluation and accumulation of knowledge. In this paper, we present two datasets which can be used to study the predictability of fertility outcomes in the Netherlands. One dataset is based on the LISS panel, a longitudinal survey which includes thousands of variables on a wide range of topics, including individual preferences and values. The other is based on the Dutch register data which lacks attitudinal data but includes detailed information about the life courses of millions of Dutch residents. We provide information about the datasets and the samples, and describe the fertility outcome of interest. We also introduce the fertility prediction data challenge PreFer which is based on these datasets and will start in Spring 2024. We outline the ways in which measuring the predictability of fertility outcomes using these datasets and combining their strengths in the data challenge can advance our understanding of fertility behaviour and computational social science. We further provide details for participants on how to take part in the data challenge.

arxiv情報

著者 Elizaveta Sivak,Paulina Pankowska,Adrienne Mendrik,Tom Emery,Javier Garcia-Bernardo,Seyit Hocuk,Kasia Karpinska,Angelica Maineri,Joris Mulder,Malvina Nissim,Gert Stulp
発行日 2024-03-22 15:13:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DB, cs.LG パーマリンク