Vision Transformers in Precision Agriculture: A Comprehensive Survey

要約

植物の病気を検出することは、現代の農業の重要な側面です。作物の健康を維持し、全体的な収量の増加に重要な役割を果たしています。
従来のアプローチはまだ価値がありますが、多くの場合、手動検査または従来の機械学習技術に依存しています。どちらもスケーラビリティと精度の制限に直面しています。
最近、Vision Transformers(VITS)が有望な代替として浮上しており、長距離依存関係の改善や視覚タスクのスケーラビリティの改善などの利点を提供しています。
この調査では、分類から検出とセグメンテーションまでのタスクをカバーする、精密農業におけるVITの適用を調査します。
まず、VITの基礎アーキテクチャを導入し、自然言語処理(NLP)からコンピュータービジョンへの移行について議論します。
議論には、畳み込みニューラルネットワーク(CNNS)などの従来のモデルにおける誘導バイアスの概念と、VITSがこれらのバイアスを緩和する方法が含まれます。
主要な方法論、データセット、パフォーマンスメトリックに焦点を当てた最近の文献の包括的なレビューを提供します。
調査には、ハイブリッドモデルとパフォーマンスの強化を見て、CNNとvitsの比較分析も含まれています。
データ要件、計算需要、モデルの解釈可能性などの技術的課題は、潜在的なソリューションとともに対処されます。
最後に、現実世界の農業環境におけるVITの統合をさらにサポートできる潜在的な研究の方向性と技術の進歩を概説します。
この研究での私たちの目標は、実践者と研究者に、賢明で精密な農業をどのように変えようとしているかについてのより深い理解を提供することです。

要約(オリジナル)

Detecting plant diseases is a crucial aspect of modern agriculture – it plays a key role in maintaining crop health and increasing overall yield. Traditional approaches, though still valuable, often rely on manual inspection or conventional machine learning techniques, both of which face limitations in scalability and accuracy. Recently, Vision Transformers (ViTs) have emerged as a promising alternative, offering benefits such as improved handling of long-range dependencies and better scalability for visual tasks. This survey explores the application of ViTs in precision agriculture, covering tasks from classification to detection and segmentation. We begin by introducing the foundational architecture of ViTs and discuss their transition from Natural Language Processing (NLP) to computer vision. The discussion includes the concept of inductive bias in traditional models like Convolutional Neural Networks (CNNs), and how ViTs mitigate these biases. We provide a comprehensive review of recent literature, focusing on key methodologies, datasets, and performance metrics. The survey also includes a comparative analysis of CNNs and ViTs, with a look at hybrid models and performance enhancements. Technical challenges – such as data requirements, computational demands, and model interpretability – are addressed alongside potential solutions. Finally, we outline potential research directions and technological advancements that could further support the integration of ViTs in real-world agricultural settings. Our goal with this study is to offer practitioners and researchers a deeper understanding of how ViTs are poised to transform smart and precision agriculture.

arxiv情報

著者 Saber Mehdipour,Seyed Abolghasem Mirroshandel,Seyed Amirhossein Tabatabaei
発行日 2025-04-30 14:50:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク