要約
この記事では、デジタル化された教会の移動記録を使用して、1800年から1920年の間にフィンランドでの内部移行の構造化されたデータセットを作成するための大規模な取り組みを紹介します。
これらの記録は、福音派ルーテル教区によって維持され、個人と家族の移住を文書化し、歴史的な人口統計パターンを研究するための貴重な情報源を提供します。
データセットには、手書きの移行記録の約200,000枚の画像から抽出された600万件以上のエントリが含まれています。
データ抽出プロセスは、レイアウト分析、テーブル検出、セル分類、手書き認識を含む深い学習パイプラインを使用して自動化されました。
完全なパイプラインがすべての画像に適用され、研究に適した構造化されたデータセットが得られました。
データセットは、産業革命前のフィンランドでの内部移動、都市化、家族の移動、および病気のspread延を研究するために使用できます。
Elim \ ‘Aki Parishのケーススタディは、地域の移動履歴をどのように再構築できるかを示しています。
この作品は、手書きのアーカイブ素材を大量に構造化されたデータに変換して、歴史的および人口統計学的研究をサポートできることを示しています。
要約(オリジナル)
This article presents a large-scale effort to create a structured dataset of internal migration in Finland between 1800 and 1920 using digitized church moving records. These records, maintained by Evangelical-Lutheran parishes, document the migration of individuals and families and offer a valuable source for studying historical demographic patterns. The dataset includes over six million entries extracted from approximately 200,000 images of handwritten migration records. The data extraction process was automated using a deep learning pipeline that included layout analysis, table detection, cell classification, and handwriting recognition. The complete pipeline was applied to all images, resulting in a structured dataset suitable for research. The dataset can be used to study internal migration, urbanization, and family migration, and the spread of disease in preindustrial Finland. A case study from the Elim\’aki parish shows how local migration histories can be reconstructed. The work demonstrates how large volumes of handwritten archival material can be transformed into structured data to support historical and demographic research.
arxiv情報
著者 | Ari Vesalainen,Jenna Kanerva,Aida Nitsch,Kiia Korsu,Ilari Larkiola,Laura Ruotsalainen,Filip Ginter |
発行日 | 2025-06-09 17:32:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google