Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training

要約

JPEG 画像圧縮アルゴリズムは、エッジおよびクラウド コンピューティング設定で画像サイズを縮小するために広く使用されている手法です。
ただし、ディープ ニューラル ネットワークで処理された画像にこのような非可逆圧縮を適用すると、精度が大幅に低下する可能性があります。
カリキュラム学習パラダイムに着想を得て、圧縮画像をカウントする群衆のためのカリキュラム事前トレーニング(CPT)と呼ばれるトレーニングアプローチを提案します。これにより、非可逆圧縮による精度の低下が緩和されます。
3 つの群衆カウント データセット、2 つの群衆カウント DNN モデル、およびさまざまなレベルの圧縮に関する広範な実験により、アプローチの有効性を検証します。
提案されたトレーニング方法は、ハイパーパラメーターに過度に敏感ではなく、特に大幅に圧縮された画像の場合、エラーを最大 19.70% 削減します。

要約(オリジナル)

JPEG image compression algorithm is a widely used technique for image size reduction in edge and cloud computing settings. However, applying such lossy compression on images processed by deep neural networks can lead to significant accuracy degradation. Inspired by the curriculum learning paradigm, we propose a training approach called curriculum pre-training (CPT) for crowd counting on compressed images, which alleviates the drop in accuracy resulting from lossy compression. We verify the effectiveness of our approach by extensive experiments on three crowd counting datasets, two crowd counting DNN models and various levels of compression. The proposed training method is not overly sensitive to hyper-parameters, and reduces the error, particularly for heavily compressed images, by up to 19.70%.

arxiv情報

著者 Arian Bakhtiarnia,Qi Zhang,Alexandros Iosifidis
発行日 2023-01-30 14:18:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク