Embrace Limited and Imperfect Training Datasets: Opportunities and Challenges in Plant Disease Recognition Using Deep Learning

要約

深層学習の最近の進歩により、植物の病気の認識に大幅な改善がもたらされました。
ただし、満足のいくパフォーマンスを達成するには、多くの場合、高品質のトレーニング データセットが必要であり、収集が困難で費用もかかります。
その結果、現在の深層学習ベースの手法を現実世界のシナリオに実際に適用することは、高品質のデータセットの不足によって妨げられています。
この論文では、貧弱なデータセットを採用することが実行可能であると主張し、これらのデータセットの使用に伴う課題を明確に定義することを目的としています。
このトピックを掘り下げるために、高品質のデータセットの特性、つまり大規模な画像と必要なアノテーションを分析し、それらを低品質のデータセットの \emph{限定的} および \emph{不完全} な性質と対比させます。
トレーニング データセットがこれらの特性から逸脱すると、問題が発生します。
包括的な理解を提供するために、これらの課題を分類する斬新で有益な分類法を提案します。
さらに、これらの課題に対処する既存の研究とアプローチの概要を紹介します。
私たちは、この論文が貧弱なデータセットを受け入れることの重要性を明らかにし、関連する課題への理解を深め、実世界のアプリケーションにディープラーニングを導入するという野心的な目標に貢献すると信じています。
進歩を促進するために、最後にいくつかの未解決の疑問について説明し、潜在的な将来の方向性を指摘します。
私たちの主な焦点は植物の病気の認識ですが、貧弱なデータセットを受け入れて分析する原則は、農業を含む幅広い領域に適用できることを強調しています。

要約(オリジナル)

Recent advancements in deep learning have brought significant improvements to plant disease recognition. However, achieving satisfactory performance often requires high-quality training datasets, which are challenging and expensive to collect. Consequently, the practical application of current deep learning-based methods in real-world scenarios is hindered by the scarcity of high-quality datasets. In this paper, we argue that embracing poor datasets is viable and aim to explicitly define the challenges associated with using these datasets. To delve into this topic, we analyze the characteristics of high-quality datasets, namely large-scale images and desired annotation, and contrast them with the \emph{limited} and \emph{imperfect} nature of poor datasets. Challenges arise when the training datasets deviate from these characteristics. To provide a comprehensive understanding, we propose a novel and informative taxonomy that categorizes these challenges. Furthermore, we offer a brief overview of existing studies and approaches that address these challenges. We believe that our paper sheds light on the importance of embracing poor datasets, enhances the understanding of the associated challenges, and contributes to the ambitious objective of deploying deep learning in real-world applications. To facilitate the progress, we finally describe several outstanding questions and point out potential future directions. Although our primary focus is on plant disease recognition, we emphasize that the principles of embracing and analyzing poor datasets are applicable to a wider range of domains, including agriculture.

arxiv情報

著者 Mingle Xu,Hyongsuk Kim,Jucheng Yang,Alvaro Fuentes,Yao Meng,Sook Yoon,Taehyun Kim,Dong Sun Park
発行日 2023-07-28 14:29:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク