要約
群集のローカリゼーションは、群集のシナリオで各インスタンスの頭の位置を予測することです。
カメラまでのインスタンスの距離はさまざまであるため、画像内のインスタンスのスケール間に大きなギャップが存在します。これは固有スケール シフトと呼ばれます。
本質的なスケール シフトが群集のローカライゼーションにおける最も重要な問題の 1 つである主な理由は、それが群集シーンのいたるところにあり、スケール分布を無秩序にすることです。
この目的のために、この論文は、固有のスケールシフトによって引き起こされるスケール分布の混乱に取り組むためのアクセスに集中しています。
カオススケール分布を正則化するために、Gaussian Mixture Scope (GMS) を提案します。
具体的には、GMS はガウス混合分布を利用してスケール分布に適応し、混合モデルを部分正規分布に分離して部分分布内のカオスを正則化します。
次に、サブディストリビューション間のカオスを正則化するためにアライメントが導入されます。
ただし、GMS はデータ分布の正則化に効果的ですが、トレーニング セット内のハード サンプルを取り除くことになり、オーバーフィッティングが発生します。
GMS によって利用される潜在的な知識をデータからモデルに転送するブロックが原因であると断言します。
したがって、知識の変換においてブリッジの役割を果たす Scoped Teacher が提案されます。
さらに、一貫性の正則化も導入され、知識の変換が実装されます。
その趣旨で、追加の制約が Scoped Teacher に展開され、教師側と生徒側の間で機能の一貫性が得られます。
提案された GMS と Scoped Teacher を群集ローカライゼーションの 5 つの主流データセットに実装することで、大規模な実験により、私たちの作業の優位性が実証されました。
さらに、既存の群集ロケーターと比較して、私たちの作業は、5 つのデータセットで包括的に F1 手段を介して最先端を実現しています。
要約(オリジナル)
Crowd localization is to predict each instance head position in crowd scenarios. Since the distance of instances being to the camera are variant, there exists tremendous gaps among scales of instances within an image, which is called the intrinsic scale shift. The core reason of intrinsic scale shift being one of the most essential issues in crowd localization is that it is ubiquitous in crowd scenes and makes scale distribution chaotic. To this end, the paper concentrates on access to tackle the chaos of the scale distribution incurred by intrinsic scale shift. We propose Gaussian Mixture Scope (GMS) to regularize the chaotic scale distribution. Concretely, the GMS utilizes a Gaussian mixture distribution to adapt to scale distribution and decouples the mixture model into sub-normal distributions to regularize the chaos within the sub-distributions. Then, an alignment is introduced to regularize the chaos among sub-distributions. However, despite that GMS is effective in regularizing the data distribution, it amounts to dislodging the hard samples in training set, which incurs overfitting. We assert that it is blamed on the block of transferring the latent knowledge exploited by GMS from data to model. Therefore, a Scoped Teacher playing a role of bridge in knowledge transform is proposed. What’ s more, the consistency regularization is also introduced to implement knowledge transform. To that effect, the further constraints are deployed on Scoped Teacher to derive feature consistence between teacher and student end. With proposed GMS and Scoped Teacher implemented on five mainstream datasets of crowd localization, the extensive experiments demonstrate the superiority of our work. Moreover, comparing with existing crowd locators, our work achieves state-of-the-art via F1-meansure comprehensively on five datasets.
arxiv情報
著者 | Juncheng Wang,Junyu Gao,Yuan Yuan,Qi Wang |
発行日 | 2023-02-23 10:24:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google