要約
公開データセットは、ナンバー プレート認識 (LPR) の最先端技術を前進させる上で重要な役割を果たしてきました。
データセット バイアスは、コンピューター ビジョン コミュニティでは深刻な問題として認識されていますが、LPR の文献ではほとんど見過ごされてきました。
LPR モデルは通常、各データセットで個別にトレーニングおよび評価されます。
このシナリオでは、多くの場合、トレーニングを受けたデータセットでは堅牢であることが証明されていますが、目に見えないデータセットではパフォーマンスが制限されていました。
したがって、この作業では、LPR コンテキストにおけるデータセット バイアスの問題を調査します。
ブラジルで収集された 4 つと中国本土で収集された 4 つの 8 つのデータセットで実験を行い、軽量分類モデルがナンバー プレート (LP) 画像のソース データセットを
95% の精度。
私たちの議論では、ほとんどの LPR モデルがおそらくそのようなシグネチャを利用して、一般化機能を失うという犠牲を払って各データセットで達成される結果を改善しているという事実に注意を向けます。
これらの結果は、データセット内のものよりも一般化 (したがって実際のパフォーマンス) のより良い指標を提供するため、クロスデータセット設定で LPR モデルを評価することの重要性を強調しています。
要約(オリジナル)
Public datasets have played a key role in advancing the state of the art in License Plate Recognition (LPR). Although dataset bias has been recognized as a severe problem in the computer vision community, it has been largely overlooked in the LPR literature. LPR models are usually trained and evaluated separately on each dataset. In this scenario, they have often proven robust in the dataset they were trained in but showed limited performance in unseen ones. Therefore, this work investigates the dataset bias problem in the LPR context. We performed experiments on eight datasets, four collected in Brazil and four in mainland China, and observed that each dataset has a unique, identifiable ‘signature’ since a lightweight classification model predicts the source dataset of a license plate (LP) image with more than 95% accuracy. In our discussion, we draw attention to the fact that most LPR models are probably exploiting such signatures to improve the results achieved in each dataset at the cost of losing generalization capability. These results emphasize the importance of evaluating LPR models in cross-dataset setups, as they provide a better indication of generalization (hence real-world performance) than within-dataset ones.
arxiv情報
著者 | Rayson Laroca,Marcelo Santos,Valter Estevam,Eduardo Luz,David Menotti |
発行日 | 2022-12-30 10:23:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google