Fuss-Free Network: A Simplified and Efficient Neural Network for Crowd Counting

要約

群衆カウントの研究の分野では、最近の多くの深層学習ベースの手法により、群衆の規模を正確に推定するための堅牢な機能が実証されています。
ただし、パフォーマンスの向上は、モデル構造の複雑さの増加によって生じることがよくあります。
本稿では、その構造のシンプルさと効率性を特徴とする群衆計数ディープラーニング モデルである Fuss-Free Network (FFNet) を紹介します。
モデルは、ニューラル ネットワークのバックボーンとマルチスケール特徴融合構造のみで構成されます。マルチスケール特徴融合構造は、それぞれフォーカス遷移モジュールのみを備えた 3 つのブランチから構成される単純なアーキテクチャであり、これらの機能を組み合わせたものです。
私たちが提案する群衆カウント モデルは、広く使用されている 4 つの公開データセットでトレーニングおよび評価されており、既存の複雑なモデルに匹敵する精度を達成しています。実験結果はさらに、群衆カウント タスクにおける優れたパフォーマンスが、
シンプルでパラメータが少なく、計算効率の高いニューラル ネットワーク構造を利用することで実現できます。

要約(オリジナル)

In the field of crowd-counting research, many recent deep learning based methods have demonstrated robust capabilities for accurately estimating crowd sizes. However, the enhancement in their performance often arises from an increase in the complexity of the model structure. This paper introduces the Fuss-Free Network (FFNet), a crowd counting deep learning model that is characterized by its simplicity and efficiency in terms of its structure. The model comprises only a backbone of a neural network and a multi-scale feature fusion structure.The multi-scale feature fusion structure is a simple architecture consisting of three branches, each only equipped with a focus transition module, and combines the features from these branches through the concatenation operation.Our proposed crowd counting model is trained and evaluated on four widely used public datasets, and it achieves accuracy that is comparable to that of existing complex models.The experimental results further indicate that excellent performance in crowd counting tasks can also be achieved by utilizing a simple, low-parameter, and computationally efficient neural network structure.

arxiv情報

著者 Lei Chen,Xingen Gao
発行日 2024-04-11 15:42:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク