InsectMamba: Insect Pest Classification with State Space Model

要約

害虫の分類は農業技術において重要な課題であり、食糧安全保障と環境の持続可能性を確保するために不可欠である。しかし、カモフラージュ性の高さや種の多様性などの要因により、害虫の識別は複雑であり、大きな障害となっている。既存の手法では、近縁の害虫種を区別するために必要なきめ細かな特徴抽出に苦労している。最近の進歩により、改良されたネットワーク構造やディープラーニングアプローチを組み合わせることで精度が向上しているが、害虫とその周囲の環境が類似しているため、課題は依然として残っている。この問題に対処するため、我々は、Mix-SSMブロック内の状態空間モデル(SSM)、畳み込みニューラルネットワーク(CNN)、多頭自己注意機構(MSA)、多層パーセプトロン(MLP)を統合した新しいアプローチであるInsectMambaを紹介する。この統合により、それぞれの符号化戦略の長所を活用することで、包括的な視覚特徴の抽出が容易になる。また、これらの特徴を適応的に集約する選択モジュールも提案されており、害虫の特徴を識別するモデルの能力を高めている。InsectMambaは、5つの昆虫害虫分類データセットにおいて強力な競合他社と比較評価された。その結果、InsectMambaの優れた性能が実証され、各モデル構成要素の重要性がアブレーション試験によって検証された。

要約(オリジナル)

The classification of insect pests is a critical task in agricultural technology, vital for ensuring food security and environmental sustainability. However, the complexity of pest identification, due to factors like high camouflage and species diversity, poses significant obstacles. Existing methods struggle with the fine-grained feature extraction needed to distinguish between closely related pest species. Although recent advancements have utilized modified network structures and combined deep learning approaches to improve accuracy, challenges persist due to the similarity between pests and their surroundings. To address this problem, we introduce InsectMamba, a novel approach that integrates State Space Models (SSMs), Convolutional Neural Networks (CNNs), Multi-Head Self-Attention mechanism (MSA), and Multilayer Perceptrons (MLPs) within Mix-SSM blocks. This integration facilitates the extraction of comprehensive visual features by leveraging the strengths of each encoding strategy. A selective module is also proposed to adaptively aggregate these features, enhancing the model’s ability to discern pest characteristics. InsectMamba was evaluated against strong competitors across five insect pest classification datasets. The results demonstrate its superior performance and verify the significance of each model component by an ablation study.

arxiv情報

著者 Qianning Wang,Chenglin Wang,Zhixin Lai,Yucheng Zhou
発行日 2024-04-04 17:34:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク