要約
コンピュータビジョンの重要な課題の1つですが、自己トレーニングによる群集のカウントは注意深く検討されていません。
実際には、完全に監視された方法は通常、手動の注釈の集中的なリソースを必要とします。
この課題に対処するために、この作業では、グラウンドトゥルースを使用して既存のデータセットを利用し、群集カウントでドメイン適応という名前のラベルのないデータセットでより堅牢な予測を生成する新しいアプローチを導入します。
ネットワークはラベル付きデータでトレーニングされますが、ターゲットドメインからのラベルのないサンプルもトレーニングプロセスに追加されます。
このプロセスでは、並行して設計された敵対的なトレーニングプロセスに加えて、エントロピーマップが計算され、最小化されます。
Shanghaitech、UCF_CC_50、およびUCF-QNRFデータセットでの実験は、クロスドメイン設定の他の最先端技術よりも一般化された方法の改善を証明しています。
要約(オリジナル)
Self-training crowd counting has not been attentively explored though it is one of the important challenges in computer vision. In practice, the fully supervised methods usually require an intensive resource of manual annotation. In order to address this challenge, this work introduces a new approach to utilize existing datasets with ground truth to produce more robust predictions on unlabeled datasets, named domain adaptation, in crowd counting. While the network is trained with labeled data, samples without labels from the target domain are also added to the training process. In this process, the entropy map is computed and minimized in addition to the adversarial training process designed in parallel. Experiments on Shanghaitech, UCF_CC_50, and UCF-QNRF datasets prove a more generalized improvement of our method over the other state-of-the-arts in the cross-domain setting.
arxiv情報
著者 | Pha Nguyen,Thanh-Dat Truong,Miaoqing Huang,Yi Liang,Ngan Le,Khoa Luu |
発行日 | 2022-06-27 15:20:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google