Crowd Density Estimation using Imperfect Labels

要約

密度推定は、群衆カウントに最も広く使用されている方法の 1 つであり、深層学習モデルが頭部アノテーション付き群衆画像から学習して、目に見えない画像内の群衆密度を推定します。
通常、モデルの学習パフォーマンスはアノテーションの精度に大きく影響され、不正確なアノテーションは予測中に位置特定や計数エラーにつながる可能性があります。
完全にラベル付けされたデータセットを使用した群衆カウントに関するかなりの量の研究が存在しますが、モデルの精度に対するアノテーション エラーの影響を調査したものはありません。
この論文では、不完全なラベル (ノイズのあるラベルと欠落したラベルの両方) が群衆カウントの精度に及ぼす影響を調査します。
我々は、深層学習モデル(アノテーターと呼ばれる)を使用して不完全なラベルを自動的に生成し、それを新しい群衆カウントモデル(ターゲットモデル)のトレーニングに使用するシステムを提案します。
2 つの群衆計数モデルと 2 つのベンチマーク データセットに関する分析では、提案されたスキームが完全なラベルでトレーニングされたモデルに近い精度を達成していることが示されており、アノテーション エラーに対する群衆モデルの堅牢性が示されています。

要約(オリジナル)

Density estimation is one of the most widely used methods for crowd counting in which a deep learning model learns from head-annotated crowd images to estimate crowd density in unseen images. Typically, the learning performance of the model is highly impacted by the accuracy of the annotations and inaccurate annotations may lead to localization and counting errors during prediction. A significant amount of works exist on crowd counting using perfectly labelled datasets but none of these explore the impact of annotation errors on the model accuracy. In this paper, we investigate the impact of imperfect labels (both noisy and missing labels) on crowd counting accuracy. We propose a system that automatically generates imperfect labels using a deep learning model (called annotator) which are then used to train a new crowd counting model (target model). Our analysis on two crowd counting models and two benchmark datasets shows that the proposed scheme achieves accuracy closer to that of the model trained with perfect labels showing the robustness of crowd models to annotation errors.

arxiv情報

著者 Muhammad Asif Khan,Hamid Menouar,Ridha Hamila
発行日 2023-07-17 09:09:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク