Forensic License Plate Recognition with Compression-Informed Transformers

要約

フォレンジックナンバープレート認識(FLPR)は、犯罪捜査のような法的な文脈において、未解読のナンバープレート(LP)を、例えば監視カメラのような、高度に圧縮された、あるいは解像度の低い映像から解読する必要がある場合、依然として未解決の課題である。この研究では、強い圧縮下での認識を改善するために、入力圧縮レベルに関する知識を埋め込むサイドインフォームドトランスフォーマーアーキテクチャを提案する。実世界の低品質データセットにおいて、ナンバープレート認識(LPR)に対するTransformerの有効性を示す。また、強く劣化した判読不可能なLP画像を含む合成データセットを提供し、それに対する知識埋め込みの影響を分析する。このネットワークは、既存のFLPR手法や標準的な最先端の画像認識モデルを凌駕し、しかも必要なパラメータが少ない。最も劣化の激しい画像に対しては、最大8.9%ポイントまで認識を向上させることができる。

要約(オリジナル)

Forensic license plate recognition (FLPR) remains an open challenge in legal contexts such as criminal investigations, where unreadable license plates (LPs) need to be deciphered from highly compressed and/or low resolution footage, e.g., from surveillance cameras. In this work, we propose a side-informed Transformer architecture that embeds knowledge on the input compression level to improve recognition under strong compression. We show the effectiveness of Transformers for license plate recognition (LPR) on a low-quality real-world dataset. We also provide a synthetic dataset that includes strongly degraded, illegible LP images and analyze the impact of knowledge embedding on it. The network outperforms existing FLPR methods and standard state-of-the art image recognition models while requiring less parameters. For the severest degraded images, we can improve recognition by up to 8.9 percent points.

arxiv情報

著者 Denise Moussa,Anatol Maier,Andreas Spruck,Jürgen Seiler,Christian Riess
発行日 2024-05-03 15:15:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク