要約
単一画像の群集カウントは、公共の安全、都市計画、交通管理などの幅広いアプリケーションでの挑戦的なコンピュータビジョンの問題です。最近の深層学習技術の開発により、群集カウントは大きな注目を集め、近年大きな成功を収めています。
この調査は、2015年以降、この地域の200以上の作品を体系的にレビューおよび要約することにより、密度マップ推定による深層学習ベースの群集カウント手法の最近の進歩の包括的な要約を提供することです。私たちの目標は、最新のレビューを提供することです。
最近のアプローチの概要を説明し、この分野の新しい研究者に設計原則とトレードオフを教育します。
公開されているデータセットと評価指標を提示した後、群集カウントの3つの主要な設計モジュール(ディープニューラルネットワーク設計、損失関数、監視信号)の詳細な比較により、最近の進歩を確認します。
公開データセットと評価指標を使用して、アプローチを調査および比較します。
いくつかの将来の方向性で調査を締めくくります。
要約(オリジナル)
Single image crowd counting is a challenging computer vision problem with wide applications in public safety, city planning, traffic management, etc. With the recent development of deep learning techniques, crowd counting has aroused much attention and achieved great success in recent years. This survey is to provide a comprehensive summary of recent advances on deep learning-based crowd counting techniques via density map estimation by systematically reviewing and summarizing more than 200 works in the area since 2015. Our goals are to provide an up-to-date review of recent approaches, and educate new researchers in this field the design principles and trade-offs. After presenting publicly available datasets and evaluation metrics, we review the recent advances with detailed comparisons on three major design modules for crowd counting: deep neural network designs, loss functions, and supervisory signals. We study and compare the approaches using the public datasets and evaluation metrics. We conclude the survey with some future directions.
arxiv情報
著者 | Haoyue Bai,Jiageng Mao,S. -H. Gary Chan |
発行日 | 2022-07-11 16:03:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google