要約
フォレンジックナンバープレート認識(FLPR)は、犯罪捜査のような法的な文脈において、未解読のナンバープレート(LP)を、例えば監視カメラのような、高度に圧縮された、あるいは解像度の低い映像から解読する必要がある場合、依然として未解決の課題である。この研究では、強い圧縮下での認識を改善するために、入力圧縮レベルに関する知識を埋め込むサイドインフォームドトランスフォーマーアーキテクチャを提案する。実世界の低品質データセットにおいて、ナンバープレート認識(LPR)に対するTransformerの有効性を示す。また、強く劣化した判読不可能なLP画像を含む合成データセットを提供し、それに対する知識埋め込みの影響を分析する。このネットワークは、既存のFLPR手法や標準的な最先端の画像認識モデルを凌駕し、しかも必要なパラメータが少ない。最も劣化の激しい画像に対しては、最大8.9%ポイントまで認識を向上させることができる。
要約(オリジナル)
Forensic license plate recognition (FLPR) remains an open challenge in legal contexts such as criminal investigations, where unreadable license plates (LPs) need to be deciphered from highly compressed and/or low resolution footage, e.g., from surveillance cameras. In this work, we propose a side-informed Transformer architecture that embeds knowledge on the input compression level to improve recognition under strong compression. We show the effectiveness of Transformers for license plate recognition (LPR) on a low-quality real-world dataset. We also provide a synthetic dataset that includes strongly degraded, illegible LP images and analyze the impact of knowledge embedding on it. The network outperforms existing FLPR methods and standard state-of-the art image recognition models while requiring less parameters. For the severest degraded images, we can improve recognition by up to 8.9 percent points.
arxiv情報
著者 | Denise Moussa,Anatol Maier,Andreas Spruck,Jürgen Seiler,Christian Riess |
発行日 | 2024-05-03 15:15:27+00:00 |
arxivサイト | arxiv_id(pdf) |