Comprehensive Performance Evaluation of YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

要約

この研究では、商業果樹園における(緑色の果実の)小果実検出のための YOLOv8、YOLOv9、および YOLOv10 オブジェクト検出アルゴリズムのすべての構成のパフォーマンスの広範な評価を実行しました。
さらに、この研究では、iPhone とマシン ビジョン センサーを使用して、5 つの異なるリンゴ品種 (サイフレッシュ、サイレート、ハニークリスプ、コスミッククリスプ、ゴールデンデリシャス) で子実の圃場での計数を実行し、検証しました。
合計 17 の異なる構成 (YOLOv8 で 5 つ、YOLOv9 で 6 つ、YOLOv10 で 6 つ) を対象としたこの包括的な調査により、mAP@50 の点では YOLOv9 が YOLOv10 および YOLOv8 を上回り、精度と再現率の点では YOLOv10x がテストした 17 の構成すべてを上回っていることが明らかになりました。
具体的には、YOLOv9 Gelan-e は 0.935 という最高の mAP@50 を達成し、YOLOv10n の 0.921 および YOLOv8s の 0.924 を上回りました。
精度の点では、YOLOv10x は 0.908 という最高の精度を達成しました。これは、テストされた他の構成と比較して優れたオブジェクト識別精度を示しています (例: YOLOv9 Gelan-c の精度は 0.903、YOLOv8m の精度は 0.897)。再現率の点では、YOLOv10s が最高の精度を達成しました。
一方、YOLOv9 Gelan m は YOLOv9 構成の中で最高のパフォーマンスを示し (0.899)、YOLOv8n は YOLOv8 構成の中で最高のパフォーマンスを示しました (0.883)。一方、YOLOv10 の 3 つの構成 (YOLOv10b、YOLOv10l、YOLOv10x) は優れた後処理を実現しました。
具体的には、YOLOv9 Gelan-e は 1.9 ミリ秒の後処理速度を記録し、YOLOv8m はテストされたすべての構成の中で最高の推論速度を達成しました。
、4.1 ミリ秒の処理時間を達成しましたが、YOLOv9 Gelan-t と YOLOv10n ではそれぞれ 9.3 ミリ秒と 5.5 ミリ秒という比較的遅い推論速度も実証されました。

要約(オリジナル)

This study performed an extensive evaluation of the performances of all configurations of YOLOv8, YOLOv9, and YOLOv10 object detection algorithms for fruitlet (of green fruit) detection in commercial orchards. Additionally, this research performed and validated in-field counting of fruitlets using an iPhone and machine vision sensors in 5 different apple varieties (Scifresh, Scilate, Honeycrisp, Cosmic crisp & Golden delicious). This comprehensive investigation of total 17 different configurations (5 for YOLOv8, 6 for YOLOv9 and 6 for YOLOv10) revealed that YOLOv9 outperforms YOLOv10 and YOLOv8 in terms of mAP@50, while YOLOv10x outperformed all 17 configurations tested in terms of precision and recall. Specifically, YOLOv9 Gelan-e achieved the highest mAP@50 of 0.935, outperforming YOLOv10n’s 0.921 and YOLOv8s’s 0.924. In terms of precision, YOLOv10x achieved the highest precision of 0.908, indicating superior object identification accuracy compared to other configurations tested (e.g. YOLOv9 Gelan-c with a precision of 0.903 and YOLOv8m with 0.897. In terms of recall, YOLOv10s achieved the highest in its series (0.872), while YOLOv9 Gelan m performed the best among YOLOv9 configurations (0.899), and YOLOv8n performed the best among the YOLOv8 configurations (0.883). Meanwhile, three configurations of YOLOv10: YOLOv10b, YOLOv10l, and YOLOv10x achieved superior post-processing speeds of 1.5 milliseconds, outperforming all other configurations within the YOLOv9 and YOLOv8 families. Specifically, YOLOv9 Gelan-e recorded a post-processing speed of 1.9 milliseconds, and YOLOv8m achieved 2.1 milliseconds. Furthermore, YOLOv8n exhibited the highest inference speed among all configurations tested, achieving a processing time of 4.1 milliseconds while YOLOv9 Gelan-t and YOLOv10n also demonstrated comparatively slower inference speeds of 9.3 ms and 5.5 ms, respectively.

arxiv情報

著者 Ranjan Sapkota,Zhichao Meng,Martin Churuvija,Xiaoqiang Du,Zenghong Ma,Manoj Karkee
発行日 2024-08-27 16:25:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク