要約
フォレンジック ナンバー プレート認識 (FLPR) は、判読できないナンバー プレート (LP) を高度に圧縮された映像や低解像度の映像 (監視カメラなど) から解読する必要がある犯罪捜査などの法的な状況では未解決の課題のままです。
この作業では、強力な圧縮下での認識を改善するために、入力圧縮レベルに関する知識を埋め込むサイドインフォームド Transformer アーキテクチャを提案します。
低品質の実世界のデータセットでのナンバー プレート認識 (LPR) に対するトランスフォーマーの有効性を示します。
また、大幅に劣化した判読不能な LP 画像を含む合成データセットを提供し、そこに埋め込まれた知識の影響を分析します。
このネットワークは、既存の FLPR メソッドや標準的な最先端の画像認識モデルよりも優れたパフォーマンスを発揮し、必要なパラメーターは少なくなります。
劣化が最も深刻な画像については、最大 8.9% まで認識を改善できます。
要約(オリジナル)
Forensic license plate recognition (FLPR) remains an open challenge in legal contexts such as criminal investigations, where unreadable license plates (LPs) need to be deciphered from highly compressed and/or low resolution footage, e.g., from surveillance cameras. In this work, we propose a side-informed Transformer architecture that embeds knowledge on the input compression level to improve recognition under strong compression. We show the effectiveness of Transformers for license plate recognition (LPR) on a low-quality real-world dataset. We also provide a synthetic dataset that includes strongly degraded, illegible LP images and analyze the impact of knowledge embedding on it. The network outperforms existing FLPR methods and standard state-of-the art image recognition models while requiring less parameters. For the severest degraded images, we can improve recognition by up to 8.9 percent points.
arxiv情報
著者 | Denise Moussa,Anatol Maier,Andreas Spruck,Jürgen Seiler,Christian Riess |
発行日 | 2022-09-16 13:45:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google