Explainable Light-Weight Deep Learning Pipeline for Improved Drought Stress Identification

要約

作物における干ばつストレスを早期に特定することは、効果的な緩和策を実施し、収量損失を減らすために不可欠である。非侵襲的イメージング技術は、水不足下の植物の微妙な生理学的変化を捉えることで、計り知れない可能性を秘めている。センサーベースの画像データは、機械学習や深層学習アルゴリズムの豊富な情報源となり、干ばつストレスの特定を目的とした更なる分析を容易にする。これらのアプローチは良好な結果をもたらすが、リアルタイムの現場での応用には、自然の農業条件の複雑さに合わせて特別に設計されたアルゴリズムが必要である。我々の研究は、自然環境においてUAVによって撮影されたジャガイモ作物の干ばつストレスを分類するための新しいディープラーニングフレームワークを提案する。その新規性は、事前に訓練されたネットワークと慎重に設計されたカスタムレイヤーとの相乗的な組み合わせにある。このアーキテクチャは、事前訓練されたネットワークの特徴抽出機能を活用する一方で、カスタムレイヤーによって、ターゲットとする次元の削減と正則化の強化を可能にし、最終的に性能の向上につながる。我々の研究の重要な革新は、説明可能性の技法であるGradient-Class Activation Mapping (Grad-CAM)の統合である。Grad-CAMは、通常ブラックボックスと呼ばれる深層学習モデルの内部構造に光を当てる。画像内でモデルのフォーカス領域を可視化することで、Grad-CAMは解釈可能性を促進し、モデルの意思決定プロセスに対する信頼を構築する。我々の提案するフレームワークは、特にDenseNet121で事前に訓練されたネットワークで優れた性能を達成し、ストレスクラスを識別する精度は97%に達し、全体の精度は91%であった。既存の最先端物体検出アルゴリズムとの比較分析により、我々のアプローチの方が、精度と精度が著しく高いという優位性が明らかになった。

要約(オリジナル)

Early identification of drought stress in crops is vital for implementing effective mitigation measures and reducing yield loss. Non-invasive imaging techniques hold immense potential by capturing subtle physiological changes in plants under water deficit. Sensor based imaging data serves as a rich source of information for machine learning and deep learning algorithms, facilitating further analysis aimed at identifying drought stress. While these approaches yield favorable results, real-time field applications requires algorithms specifically designed for the complexities of natural agricultural conditions. Our work proposes a novel deep learning framework for classifying drought stress in potato crops captured by UAVs in natural settings. The novelty lies in the synergistic combination of a pre-trained network with carefully designed custom layers. This architecture leverages feature extraction capabilities of the pre-trained network while the custom layers enable targeted dimensionality reduction and enhanced regularization, ultimately leading to improved performance. A key innovation of our work involves the integration of Gradient-Class Activation Mapping (Grad-CAM), an explainability technique. Grad-CAM sheds light on the internal workings of the deep learning model, typically referred to as a black box. By visualizing the focus areas of the model within the images, Grad-CAM fosters interpretability and builds trust in the decision-making process of the model. Our proposed framework achieves superior performance, particularly with the DenseNet121 pre-trained network, reaching a precision of 97% to identify the stressed class with an overall accuracy of 91%. Comparative analysis of existing state-of-the-art object detection algorithms reveals the superiority of our approach in significantly higher precision and accuracy.

arxiv情報

著者 Aswini Kumar Patra,Lingaraj Sahoo
発行日 2024-05-03 13:52:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク