Feature Mixing for Writer Retrieval and Identification on Papyri Fragments

要約

この論文は、特定の作家に関連する断片と同じ画像に対応する断片の識別に焦点を当てて、パピルスの作家の検索と識別に対する深層学習ベースのアプローチを提案します。
我々は、残余バックボーンと特徴混合ステージを組み合わせて検索パフォーマンスを向上させる新しいニューラル ネットワーク アーキテクチャを提案します。最終的な記述子は射影層から導出されます。
この方法論は 2 つのベンチマークで評価されます。PapyRow ではライターとページの取得で 26.6 % と 24.9 % の mAP を達成し、HisFragIR20 では最先端のパフォーマンス (44.0 % と 29.3 % mAP) を示しています。
さらに、当社のネットワークのライター識別精度は 28.7 % です。
さらに、フラグメントに対する 2 つの 2 値化手法の影響に関する実験を実施し、2 値化によってパフォーマンスが向上しないことを示します。
私たちのコードとモデルはコミュニティで利用できます。

要約(オリジナル)

This paper proposes a deep-learning-based approach to writer retrieval and identification for papyri, with a focus on identifying fragments associated with a specific writer and those corresponding to the same image. We present a novel neural network architecture that combines a residual backbone with a feature mixing stage to improve retrieval performance, and the final descriptor is derived from a projection layer. The methodology is evaluated on two benchmarks: PapyRow, where we achieve a mAP of 26.6 % and 24.9 % on writer and page retrieval, and HisFragIR20, showing state-of-the-art performance (44.0 % and 29.3 % mAP). Furthermore, our network has an accuracy of 28.7 % for writer identification. Additionally, we conduct experiments on the influence of two binarization techniques on fragments and show that binarizing does not enhance performance. Our code and models are available to the community.

arxiv情報

著者 Marco Peer,Robert Sablatnig
発行日 2023-06-22 14:55:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク