License Plate Recognition Based On Multi-Angle View Model

要約

研究の分野では、カメラで撮影した画像/ビデオ内のテキストの検出/認識は、研究者にとって非常に困難な問題です。
特定の進歩により高精度が達成されたにもかかわらず、現在の手法を実際のシナリオに適用するには、依然として大幅な改善が必要です。
この論文は、画像/ビデオ内のテキスト検出とは異なり、異なる視点の複数のフレームを統合することによって、ナンバー プレート内のテキスト検出の問題に取り組んでいます。
提案された方法は、視点ごとに、ナンバー プレートの文字コンポーネント、具体的には隅の点と領域を特徴付ける記述的特徴を抽出します。
具体的には、view-1、view-2、view-3 という 3 つの視点を提示し、類似性レベルと距離メトリックの推定に基づいて、同じナンバー プレートの行からのテキスト コンポーネントの復元を容易にする最も近い隣接コンポーネントを特定します。
その後、ナンバー プレート内のテキスト認識に CnOCR 方式を採用しました。
さまざまなシナリオの画像のペアで構成される自己収集データセット (PTITPlate) と公的に利用可能なスタンフォード カーズ データセットに関する実験結果は、提案された方法が既存のアプローチよりも優れていることを示しています。

要約(オリジナル)

In the realm of research, the detection/recognition of text within images/videos captured by cameras constitutes a highly challenging problem for researchers. Despite certain advancements achieving high accuracy, current methods still require substantial improvements to be applicable in practical scenarios. Diverging from text detection in images/videos, this paper addresses the issue of text detection within license plates by amalgamating multiple frames of distinct perspectives. For each viewpoint, the proposed method extracts descriptive features characterizing the text components of the license plate, specifically corner points and area. Concretely, we present three viewpoints: view-1, view-2, and view-3, to identify the nearest neighboring components facilitating the restoration of text components from the same license plate line based on estimations of similarity levels and distance metrics. Subsequently, we employ the CnOCR method for text recognition within license plates. Experimental results on the self-collected dataset (PTITPlates), comprising pairs of images in various scenarios, and the publicly available Stanford Cars Dataset, demonstrate the superiority of the proposed method over existing approaches.

arxiv情報

著者 Dat Tran-Anh,Khanh Linh Tran,Hoai-Nam Vu
発行日 2023-09-22 16:12:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク