Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training


JPEG 画像圧縮アルゴリズムは、エッジおよびクラウド コンピューティング設定で画像サイズを縮小するために広く使用されている手法です。
ただし、ディープ ニューラル ネットワークで処理された画像にこのような非可逆圧縮を適用すると、精度が大幅に低下する可能性があります。
3 つの群衆カウント データセット、2 つの群衆カウント DNN モデル、およびさまざまなレベルの圧縮に関する広範な実験により、アプローチの有効性を検証します。
提案されたトレーニング方法は、ハイパーパラメーターに過度に敏感ではなく、特に圧縮率の高い画像の場合、エラーを最大 19.70% 削減します。


JPEG image compression algorithm is a widely used technique for image size reduction in edge and cloud computing settings. However, applying such lossy compression on images processed by deep neural networks can lead to significant accuracy degradation. Inspired by the curriculum learning paradigm, we present a novel training approach called curriculum pre-training (CPT) for crowd counting on compressed images, which alleviates the drop in accuracy resulting from lossy compression. We verify the effectiveness of our approach by extensive experiments on three crowd counting datasets, two crowd counting DNN models and various levels of compression. Our proposed training method is not overly sensitive to hyper-parameters, and reduces the error, particularly for heavily compressed images, by up to 19.70%.


著者 Arian Bakhtiarnia,Qi Zhang,Alexandros Iosifidis
発行日 2022-08-15 08:43:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク