Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention

要約

大豆の葉疾患の検出は、農業の生産性にとって重要ですが、視覚的に類似した症状と従来の方法での解釈が制限されているため、課題に直面しています。
畳み込みニューラルネットワーク(CNN)は空間的特徴抽出に優れていますが、多くの場合、誤分類につながるイメージ間の関係依存関係を無視します。
このホワイトペーパーでは、リレーショナルモデリングのために局所的な特徴抽出とグラフセージのためにMobileNETV2を相乗化する解釈可能なハイブリッドシーケンシャルCNN-グラフニューラルネットワーク(GNN)フレームワークを提案します。
フレームワークは、ノードがリーフ画像を表すグラフを構築し、エッジはコサインの類似性ベースの隣接マトリックスと適応型近傍サンプリングによって定義されます。
この設計は、細粒の病変の特徴と世界的な症状パターンを捉え、クラス間の類似性の課題に対処します。
クロスモーダルの解釈は、グレードカムおよび固有カムの視覚化を介して達成され、ヒートマップを生成して疾患の影響領域を強調します。
10個の大豆葉疾患のデータセットで評価されたこのモデルは、$ 97.16 \%$の精度を達成し、スタンドアロンCNN($ \ le95.04 \%$)および従来の機械学習モデル($ \ le77.05 \%$)を上回ります。
アブレーション研究は、並列またはシングルモデルの構成よりもシーケンシャルアーキテクチャの優位性を検証します。
わずか230万のパラメーターを備えた軽量MobileNetv2-Graphsageの組み合わせにより、計算効率が保証され、リソースが制約された環境でリアルタイムの展開が可能になります。
提案されたアプローチは、正確な分類と実用的な適用性との間のギャップを埋め、植物病理研究におけるCNN-GNN統合を進めながら、農業診断のための堅牢で解釈可能なツールを提供します。

要約(オリジナル)

Soybean leaf disease detection is critical for agricultural productivity but faces challenges due to visually similar symptoms and limited interpretability in conventional methods. While Convolutional Neural Networks (CNNs) excel in spatial feature extraction, they often neglect inter-image relational dependencies, leading to misclassifications. This paper proposes an interpretable hybrid Sequential CNN-Graph Neural Network (GNN) framework that synergizes MobileNetV2 for localized feature extraction and GraphSAGE for relational modeling. The framework constructs a graph where nodes represent leaf images, with edges defined by cosine similarity-based adjacency matrices and adaptive neighborhood sampling. This design captures fine-grained lesion features and global symptom patterns, addressing inter-class similarity challenges. Cross-modal interpretability is achieved via Grad-CAM and Eigen-CAM visualizations, generating heatmaps to highlight disease-influential regions. Evaluated on a dataset of ten soybean leaf diseases, the model achieves $97.16\%$ accuracy, surpassing standalone CNNs ($\le95.04\%$) and traditional machine learning models ($\le77.05\%$). Ablation studies validate the sequential architecture’s superiority over parallel or single-model configurations. With only 2.3 million parameters, the lightweight MobileNetV2-GraphSAGE combination ensures computational efficiency, enabling real-time deployment in resource-constrained environments. The proposed approach bridges the gap between accurate classification and practical applicability, offering a robust, interpretable tool for agricultural diagnostics while advancing CNN-GNN integration in plant pathology research.

arxiv情報

著者 Md Abrar Jahin,Soudeep Shahriar,M. F. Mridha,Md. Jakir Hossen,Nilanjan Dey
発行日 2025-04-10 15:14:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク