Locally Grouped and Scale-Guided Attention for Dense Pest Counting

要約

この研究では、デジタルトラップで捕獲された密集して分布する害虫を予測するための新しい密集害虫計数問題を導入しました。
まばらに分布する物体を対象とした従来の検出ベースの計数モデルとは異なり、トラップベースの害虫計数では、深刻な遮蔽、幅広いポーズのバリエーション、色やテクスチャの類似した外観などの課題を引き起こす密集した害虫の分布に対処する必要があります。
これらの問題に対処するには、ローカル アテンション メカニズムを組み込むことが不可欠です。ローカル アテンション メカニズムは、ローカルで重要な領域と重要ではない領域を特定して、ローカルにグループ化された特徴を学習し、それによって識別パフォーマンスを向上させます。
したがって、この研究は、ローカルにグループ化され、スケールに応じて誘導される注意をマルチスケール CenterNet フレームワークに統合する新しい設計を提示します。
類似の属性を持つ局所フィーチャをグループ化するために、害虫重心情報を含む最初の砂時計によって予測されるヒートマップを使用する簡単な方法が導入され、複雑なクラスタリング モデルの必要性がなくなります。
注意力を高めるために、ピクセル アテンション モジュールはヒートマップを学習可能なマップに変換します。
その後、スケールに基づく注意を導入してオブジェクトと背景の特徴をより識別しやすくし、マルチスケール特徴の融合を実現します。
実験を通じて、提案されたモデルが局所的なグループ化と識別特徴注意学習に基づいてオブジェクトの特徴を強化することが検証されました。
さらに、提案されたモデルは、オクルージョンと姿勢変動の問題を克服するのに非常に効果的であり、密集した害虫の計数にさらに適しています。
特に、提案されたモデルは最先端のモデルを大幅に上回り、害虫の密集数のカウントに顕著に貢献します。

要約(オリジナル)

This study introduces a new dense pest counting problem to predict densely distributed pests captured by digital traps. Unlike traditional detection-based counting models for sparsely distributed objects, trap-based pest counting must deal with dense pest distributions that pose challenges such as severe occlusion, wide pose variation, and similar appearances in colors and textures. To address these problems, it is essential to incorporate the local attention mechanism, which identifies locally important and unimportant areas to learn locally grouped features, thereby enhancing discriminative performance. Accordingly, this study presents a novel design that integrates locally grouped and scale-guided attention into a multiscale CenterNet framework. To group local features with similar attributes, a straightforward method is introduced using the heatmap predicted by the first hourglass containing pest centroid information, which eliminates the need for complex clustering models. To enhance attentiveness, the pixel attention module transforms the heatmap into a learnable map. Subsequently, scale-guided attention is deployed to make the object and background features more discriminative, achieving multiscale feature fusion. Through experiments, the proposed model is verified to enhance object features based on local grouping and discriminative feature attention learning. Additionally, the proposed model is highly effective in overcoming occlusion and pose variation problems, making it more suitable for dense pest counting. In particular, the proposed model outperforms state-of-the-art models by a large margin, with a remarkable contribution to dense pest counting.

arxiv情報

著者 Chang-Hwan Son
発行日 2024-08-29 13:02:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク