Apple Counting using Convolutional Neural Networks

要約

果樹園などの実世界の設定で画像から正確で信頼性の高い果物や野菜の数を推定することは、最近大きな注目を集めている困難な問題です。
収穫前の果実数の推定は、物流計画に役立つ情報を提供します。
果物の検出に向けてかなりの進歩が見られましたが、実際の数を推定することは依然として困難です。
実際には、果物はしばしば一緒にクラスター化されます。
したがって、果物のみを検出する方法では、正確な果物の数を推定するための一般的なソリューションを提供できません。
さらに、園芸研究では、単一の収量推定ではなく、クラスターあたりのリンゴの数の分布などのより詳細な情報が望ましい.
この作業では、画像からの果物の数え方をマルチクラスの分類問題として定式化し、畳み込みニューラル ネットワークをトレーニングすることで解決します。
最初に、この方法の画像ごとの精度を評価し、4 つのテスト データセットでガウス混合モデルに基づく最先端の方法と比較します。
ガウス混合モデルベースの方法のパラメーターは各データセットに対して特別に調整されていますが、ネットワークは 4 つのデータセットのうち 3 つにおいて最大 94\% の精度で優れています。
次に、この方法を使用して、グラウンド トゥルースがある 2 つのデータセットの歩留まりを推定します。
私たちの方法は 96-97\% の精度を達成しました。
詳細については、こちらのビデオをご覧ください: https://www.youtube.com/watch?v=Le0mb5P-SYc}{https://www.youtube.com/watch?v=Le0mb5P-SYc.

要約(オリジナル)

Estimating accurate and reliable fruit and vegetable counts from images in real-world settings, such as orchards, is a challenging problem that has received significant recent attention. Estimating fruit counts before harvest provides useful information for logistics planning. While considerable progress has been made toward fruit detection, estimating the actual counts remains challenging. In practice, fruits are often clustered together. Therefore, methods that only detect fruits fail to offer general solutions to estimate accurate fruit counts. Furthermore, in horticultural studies, rather than a single yield estimate, finer information such as the distribution of the number of apples per cluster is desirable. In this work, we formulate fruit counting from images as a multi-class classification problem and solve it by training a Convolutional Neural Network. We first evaluate the per-image accuracy of our method and compare it with a state-of-the-art method based on Gaussian Mixture Models over four test datasets. Even though the parameters of the Gaussian Mixture Model-based method are specifically tuned for each dataset, our network outperforms it in three out of four datasets with a maximum of 94\% accuracy. Next, we use the method to estimate the yield for two datasets for which we have ground truth. Our method achieved 96-97\% accuracies. For additional details please see our video here: https://www.youtube.com/watch?v=Le0mb5P-SYc}{https://www.youtube.com/watch?v=Le0mb5P-SYc.

arxiv情報

著者 Nicolai Häni,Pravakar Roy,Volkan Isler
発行日 2022-08-24 14:13:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク