Trap-Based Pest Counting: Multiscale and Deformable Attention CenterNet Integrating Internal LR and HR Joint Feature Learning

要約

タイトル:トラップベースの害虫数カウント:内部LRとHRの共同特徴量学習を統合した、マルチスケールで変形可能なアテンションCenterNet

要約:
– 害虫数カウントは、早期に害虫の数を予測することで、迅速な害虫駆除が可能になり、作物の被害を減らし、生産性を向上させることができるため、非常に重要です。
– 近年、ライトトラップが害虫誘引と撮影のために増加しながら、害虫画像は、厳しい遮蔽、広範なポーズの変化、さらにはスケールの変化などにより、害虫の外観に幅広い変動があり、害虫数カウントはより困難になります。
– これらの問題に対処するために、本研究では、内部低解像度(LR)と高解像度(HR)の共同特徴学習を組み込んだマルチスケールで変形可能なアテンションCenterNet(Mada-CenterNet)と呼ばれる新しい害虫数カウントモデルを提案しています。
– 提案されたMada-CenterNetは、従来のCenterNetと比較して、2段階の手法でマルチスケールヒートマップ生成アプローチを採用し、スケール変化に適応的にLRとHRヒートマップを予測することができます。また、ポーズと遮蔽の問題を克服するために、変形可能でマルチスケールなアテンションを用いた新しいHourglassスキップ接続が設計され、内部LRとHRの共同特徴学習と幾何学的変形が組み込まれ、より良い害虫数カウントの精度を実現します。
– 実験により、提案されたMada-CenterNetがマルチスケールヒートマップ生成、共同内部特徴量学習、変形可能なマルチスケールアテンションにより、HRヒートマップをより正確に生成し、厳しい遮蔽、ポーズ、スケールの変動を克服することができることが確認されました。実験結果は、提案されたモデルが最新の人群カウントと物体検出モデルを上回っていることを示しています。

要約(オリジナル)

Pest counting, which predicts the number of pests in the early stage, is very important because it enables rapid pest control, reduces damage to crops, and improves productivity. In recent years, light traps have been increasingly used to lure and photograph pests for pest counting. However, pest images have a wide range of variability in pest appearance owing to severe occlusion, wide pose variation, and even scale variation. This makes pest counting more challenging. To address these issues, this study proposes a new pest counting model referred to as multiscale and deformable attention CenterNet (Mada-CenterNet) for internal low-resolution (LR) and high-resolution (HR) joint feature learning. Compared with the conventional CenterNet, the proposed Mada-CenterNet adopts a multiscale heatmap generation approach in a two-step fashion to predict LR and HR heatmaps adaptively learned to scale variations, that is, changes in the number of pests. In addition, to overcome the pose and occlusion problems, a new between-hourglass skip connection based on deformable and multiscale attention is designed to ensure internal LR and HR joint feature learning and incorporate geometric deformation, thereby resulting in an improved pest counting accuracy. Through experiments, the proposed Mada-CenterNet is verified to generate the HR heatmap more accurately and improve pest counting accuracy owing to multiscale heatmap generation, joint internal feature learning, and deformable and multiscale attention. In addition, the proposed model is confirmed to be effective in overcoming severe occlusions and variations in pose and scale. The experimental results show that the proposed model outperforms state-of-the-art crowd counting and object detection models.

arxiv情報

著者 Jae-Hyeon Lee,Chang-Hwan Son
発行日 2023-04-05 08:23:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV パーマリンク