要約
超解像度 (SR) 技術は、特に正確なナンバー プレート認識が重要なセキュリティや監視などのアプリケーションにおいて、低解像度画像の品質を向上させる上で極めて重要な役割を果たします。
この研究では、ナンバー プレート超解像度 (LPSR) 特有の課題に対処するために、ピクセルベースの損失と埋め込み類似性学習を組み合わせた新しいフレームワークを提案します。
導入されたピクセルおよび埋め込み一貫性損失 (PECL) は、シャム ネットワークを統合し、コントラスト損失を適用して埋め込みの類似性を強制し、知覚的および構造的な忠実度を向上させます。
このフレームワークは、ピクセル単位の精度と埋め込みレベルの一貫性を効果的にバランスさせることにより、高解像度 (HR) と超解像度 (SR) のナンバー プレート間でのきめの細かい特徴の優れた位置合わせを実現します。
CCPD データセットに関する広範な実験により、提案されたフレームワークの有効性が検証され、PSNR_RGB、PSNR_Y、および光学式文字認識 (OCR) の精度の点で最先端の方法と比較して一貫した改善が実証されました。
これらの結果は、類似性学習を埋め込むことで、極端な超解像度シナリオにおける知覚品質とタスク固有のパフォーマンスの両方を向上させる可能性を強調しています。
要約(オリジナル)
Super-resolution (SR) techniques play a pivotal role in enhancing the quality of low-resolution images, particularly for applications such as security and surveillance, where accurate license plate recognition is crucial. This study proposes a novel framework that combines pixel-based loss with embedding similarity learning to address the unique challenges of license plate super-resolution (LPSR). The introduced pixel and embedding consistency loss (PECL) integrates a Siamese network and applies contrastive loss to force embedding similarities to improve perceptual and structural fidelity. By effectively balancing pixel-wise accuracy with embedding-level consistency, the framework achieves superior alignment of fine-grained features between high-resolution (HR) and super-resolved (SR) license plates. Extensive experiments on the CCPD dataset validate the efficacy of the proposed framework, demonstrating consistent improvements over state-of-the-art methods in terms of PSNR_RGB, PSNR_Y and optical character recognition (OCR) accuracy. These results highlight the potential of embedding similarity learning to advance both perceptual quality and task-specific performance in extreme super-resolution scenarios.
arxiv情報
著者 | Abderrezzaq Sendjasni,Mohamed-Chaker Larabi |
発行日 | 2025-01-08 14:29:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google