要約
自己学習型群集計測は、コンピュータビジョンにおける重要な課題の一つであるにもかかわらず、これまであまり研究されてこなかった。実際、完全教師ありの手法では、通常、手動アノテーションという集中的なリソースを必要とする。この課題を解決するために、本研究では、群衆計測において、ラベルのないデータセットに対してより頑健な予測を行うために、真実の根拠を持つ既存のデータセットを利用する新しいアプローチ(ドメイン適応と呼ぶ)を導入する。ネットワークはラベル付きデータで学習されるが、ターゲットドメインからのラベルのないサンプルも学習プロセスに追加される。この際、並行して設計された敵対的学習処理に加えて、エントロピーマップが計算され、最小化される。Shanghaitech, UCF_CC_50, UCF-QNRFデータセットでの実験により、本手法がクロスドメイン設定において他の最先端技術よりも一般的に改善されていることが証明された。
要約(オリジナル)
Self-training crowd counting has not been attentively explored though it is one of the important challenges in computer vision. In practice, the fully supervised methods usually require an intensive resource of manual annotation. In order to address this challenge, this work introduces a new approach to utilize existing datasets with ground truth to produce more robust predictions on unlabeled datasets, named domain adaptation, in crowd counting. While the network is trained with labeled data, samples without labels from the target domain are also added to the training process. In this process, the entropy map is computed and minimized in addition to the adversarial training process designed in parallel. Experiments on Shanghaitech, UCF_CC_50, and UCF-QNRF datasets prove a more generalized improvement of our method over the other state-of-the-arts in the cross-domain setting.
arxiv情報
著者 | Pha Nguyen,Thanh-Dat Truong,Miaoqing Huang,Yi Liang,Ngan Le,Khoa Luu |
発行日 | 2022-06-07 16:35:08+00:00 |
arxivサイト | arxiv_id(pdf) |