Self-Supervised Backbone Framework for Diverse Agricultural Vision Tasks

要約

農業におけるコンピューター ビジョンは、農業をデータ駆動型で正確な持続可能な産業に変える能力により、革新的なものです。
ディープラーニングにより、農業ビジョンは膨大で複雑な視覚データを分析できるようになりましたが、注釈付きの大規模なデータセットの可用性に大きく依存しています。
手動でのラベル付けは間違いが発生しやすく、時間と費用がかかるため、これが依然としてボトルネックとなっています。
効率的なラベル付けアプローチが欠如しているため、生の農業画像データから意味のある特徴表現を学習するパラダイム シフトとして自己教師あり学習を検討するようになりました。
この研究では、大規模な注釈付きデータセットの必要性を排除することで、自己教師あり表現学習がどのようにして多様な農業ビジョンタスクへの潜在的な適用可能性を解き放つかを探ります。
私たちは、現実世界の農業現場画像の注釈のない大規模なデータセットで ResNet-50 バックボーンを事前トレーニングするための、対照学習アプローチである SimCLR を利用した軽量フレームワークを提案します。
私たちの実験分析と結果は、このモデルが、論文で議論されている広範囲の下流農業タスクに適用できる堅牢な機能を学習していることを示しています。
さらに、注釈付きデータへの依存が軽減されることで、私たちのアプローチはよりコスト効率が高く、利用しやすくなり、農業におけるコンピューター ビジョンのより広範な導入への道が開かれます。

要約(オリジナル)

Computer vision in agriculture is game-changing with its ability to transform farming into a data-driven, precise, and sustainable industry. Deep learning has empowered agriculture vision to analyze vast, complex visual data, but heavily rely on the availability of large annotated datasets. This remains a bottleneck as manual labeling is error-prone, time-consuming, and expensive. The lack of efficient labeling approaches inspired us to consider self-supervised learning as a paradigm shift, learning meaningful feature representations from raw agricultural image data. In this work, we explore how self-supervised representation learning unlocks the potential applicability to diverse agriculture vision tasks by eliminating the need for large-scale annotated datasets. We propose a lightweight framework utilizing SimCLR, a contrastive learning approach, to pre-train a ResNet-50 backbone on a large, unannotated dataset of real-world agriculture field images. Our experimental analysis and results indicate that the model learns robust features applicable to a broad range of downstream agriculture tasks discussed in the paper. Additionally, the reduced reliance on annotated data makes our approach more cost-effective and accessible, paving the way for broader adoption of computer vision in agriculture.

arxiv情報

著者 Sudhir Sornapudi,Rajhans Singh
発行日 2024-03-22 14:46:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク