要約
画像ベースの機械学習モデルを使用して、農産物の選別と等級付けをより効率的に行うことができます。
多くの地域では、ポストハーベスト サプライ チェーンの集中化と自動化が行われていないため、このようなシステムの実装は困難な場合があります。
多くの場合、利害関係者は小さすぎて機械学習を専門に扱うことができず、大規模なトレーニング データ セットは利用できません。
事前にトレーニングされたビジョン トランスフォーマーに基づく画像の機械学習手順を提案します。
ディープ ニューラル ネットワークを (再) トレーニングしないため、畳み込みニューラル ネットワーク (CNN) をトレーニングする現在の標準的なアプローチよりも実装が簡単です。
リンゴの欠陥検出とバナナの熟度推定の 2 つのデータ セットに基づいて、アプローチを評価します。
私たちのモデルは、最高のパフォーマンスを発揮する CNN よりも 1% 以下低い競争力のある分類精度を達成しています。
同時に、90% の精度を達成するために必要なトレーニング サンプルは 3 分の 1 です。
要約(オリジナル)
Image-based machine learning models can be used to make the sorting and grading of agricultural products more efficient. In many regions, implementing such systems can be difficult due to the lack of centralization and automation of postharvest supply chains. Stakeholders are often too small to specialize in machine learning, and large training data sets are unavailable. We propose a machine learning procedure for images based on pre-trained Vision Transformers. It is easier to implement than the current standard approach of training Convolutional Neural Networks (CNNs) as we do not (re-)train deep neural networks. We evaluate our approach based on two data sets for apple defect detection and banana ripeness estimation. Our model achieves a competitive classification accuracy equal to or less than one percent below the best-performing CNN. At the same time, it requires three times fewer training samples to achieve a 90% accuracy.
arxiv情報
著者 | Manuel Knott,Fernando Perez-Cruz,Thijs Defraeye |
発行日 | 2022-08-19 13:32:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google