要約
歴史的写本に描かれた何十万もの図表から幾何学的内容を自動的に抽出できれば、歴史家は地球規模での天文学知識の拡散を研究できるようになるでしょう。
しかし、最先端のベクトル化手法は、多くの場合、現代のデータに取り組むために設計されていますが、歴史的な天文図の複雑さと多様性には適応していません。
したがって、私たちの貢献は 2 つあります。
まず、12 世紀から 18 世紀までのさまざまな伝統からの 303 個の天体図からなる独自のデータセットを紹介します。これらには 3000 以上の線分、円、円弧が注釈されています。
次に、DINO-DETR に基づいて構築されたモデルを開発し、複数の幾何学的プリミティブの予測を可能にします。
合成データのみでトレーニングでき、困難なデータセットでプリミティブを正確に予測できることを示します。
私たちのアプローチは、複数のプリミティブに意味のあるパラメータ化を導入し、検出とパラメータ改良のための共同トレーニングを行い、変形可能な注意と豊富な合成データでのトレーニングを使用することにより、ラインに制限されている LETR ベースラインを大幅に改善します。
データセットとコードは Web ページから入手できます。
要約(オリジナル)
Automatically extracting the geometric content from the hundreds of thousands of diagrams drawn in historical manuscripts would enable historians to study the diffusion of astronomical knowledge on a global scale. However, state-of-the-art vectorization methods, often designed to tackle modern data, are not adapted to the complexity and diversity of historical astronomical diagrams. Our contribution is thus twofold. First, we introduce a unique dataset of 303 astronomical diagrams from diverse traditions, ranging from the XIIth to the XVIIIth century, annotated with more than 3000 line segments, circles and arcs. Second, we develop a model that builds on DINO-DETR to enable the prediction of multiple geometric primitives. We show that it can be trained solely on synthetic data and accurately predict primitives on our challenging dataset. Our approach widely improves over the LETR baseline, which is restricted to lines, by introducing a meaningful parametrization for multiple primitives, jointly training for detection and parameter refinement, using deformable attention and training on rich synthetic data. Our dataset and code are available on our webpage.
arxiv情報
著者 | Syrine Kalleli,Scott Trigg,Ségolène Albouy,Mathieu Husson,Mathieu Aubry |
発行日 | 2024-03-13 17:20:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google