Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map

要約

古地図は、過去の詳細な地理情報を記録した貴重な資料です。
ただし、これらのマップは通常、印刷された形式で入手できるため、最新のコンピューターベースの分析には適していません。
これらのマップを機械可読形式にデジタル化すると、効率的な計算分析が可能になります。
この論文では、深層学習ベースのセマンティック セグメンテーションを使用したデジタル化への自動化アプローチを提案します。これは、スキャンされた歴史地図の各ピクセルにセマンティック ラベルを割り当てます。
このプロセスにおける主な課題は、手動によるラベル付けには時間と労力がかかるため、ディープ ニューラル ネットワークのトレーニングに必要なグラウンドトゥルースのアノテーションが不足していることです。
この問題に対処するために、モデルを微調整するために弱く教師付きの年齢追跡戦略を導入します。
このアプローチは、隣接する時代の古地図間の外観と土地利用パターンの類似性を利用して、トレーニング プロセスをガイドします。
具体的には、1 つのマップのモデル予測が、隣接する期間のマップでトレーニングするための擬似ラベルとして利用されます。
新しく厳選された \textit{ハーメルン} データセットに対して行われた実験は、提案された年齢追跡戦略がベースライン モデルと比較してセグメンテーション パフォーマンスを大幅に向上させることを示しています。
最良のシナリオでは、和集合に対する平均積分 (mIoU) は 77.3\% に達し、ベースライン手法と比較して約 20\% の改善を反映しています。
さらに、微調整されたモデルは平均全体精度 97% を達成し、歴史的地図をデジタル化するためのアプローチの有効性を強調しました。

要約(オリジナル)

Historical maps are valuable resources that capture detailed geographical information from the past. However, these maps are typically available in printed formats, which are not conducive to modern computer-based analyses. Digitizing these maps into a machine-readable format enables efficient computational analysis. In this paper, we propose an automated approach to digitization using deep-learning-based semantic segmentation, which assigns a semantic label to each pixel in scanned historical maps. A key challenge in this process is the lack of ground-truth annotations required for training deep neural networks, as manual labeling is time-consuming and labor-intensive. To address this issue, we introduce a weakly-supervised age-tracing strategy for model fine-tuning. This approach exploits the similarity in appearance and land-use patterns between historical maps from neighboring time periods to guide the training process. Specifically, model predictions for one map are utilized as pseudo-labels for training on maps from adjacent time periods. Experiments conducted on our newly curated \textit{Hameln} dataset demonstrate that the proposed age-tracing strategy significantly enhances segmentation performance compared to baseline models. In the best-case scenario, the mean Intersection over Union (mIoU) achieved 77.3\%, reflecting an improvement of approximately 20\% over baseline methods. Additionally, the fine-tuned model achieved an average overall accuracy of 97\%, highlighting the effectiveness of our approach for digitizing historical maps.

arxiv情報

著者 Yunshuang Yuan,Frank Thiemann,Monika Sester
発行日 2025-01-03 14:55:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク