Comparing YOLO11 and YOLOv8 for instance segmentation of occluded and non-occluded immature green fruits in complex orchard environment

要約

本研究では、果樹園環境における未成熟な青リンゴのインスタンスセグメンテーション能力に焦点を当て、’You Only Look Once'(YOLO)シリーズの最新機種であるYOLO11とYOLOv8について包括的な性能評価を行った。YOLO11n-segは、0.831という特筆すべきスコアで、すべてのカテゴリーで最高のマスク精度を達成し、果実検出における有効性を強調した。YOLO11m-segとYOLO11l-segは、非閉塞と閉塞の果実小片のセグメンテーションに優れ、それぞれ0.851と0.829のスコアを得た。さらに、YOLO11x-segは、すべてのカテゴリーでマスク・リコールでリードし、0.815のスコアを達成しました。YOLO11m-segは、非閉塞の未熟な緑色の果実で0.858と最高のパフォーマンスを示し、YOLOv8x-segは、閉塞したカテゴリーで0.800とリードしました。平均平均精度(mAP@50)では、YOLO11m-segが一貫して優れており、ボックス・セグメンテーションとマスク・セグメンテーションの両方で、「すべて」クラスで0.876と0.860、非閉塞未成熟果実でそれぞれ0.908と0.909と、最高スコアを記録した。YOLO11l-segとYOLOv8l-segは、閉塞した未成熟果実のボックスmAP@50が0.847でトップであることを共有し、YOLO11m-segは0.810で最高のマスクmAP@50を達成した。YOLO11の進化にもかかわらず、YOLOv8nは画像処理速度で他の機種を上回り、YOLO11シリーズ最速の4.8ミリ秒に対し、3.3ミリ秒という驚異的な推論速度を達成し、複雑な緑色果実環境に関連するリアルタイムの農業アプリケーションに適していることが明らかになった。

要約(オリジナル)

This study conducted a comprehensive performance evaluation on YOLO11 and YOLOv8, the latest in the ‘You Only Look Once’ (YOLO) series, focusing on their instance segmentation capabilities for immature green apples in orchard environments. YOLO11n-seg achieved the highest mask precision across all categories with a notable score of 0.831, highlighting its effectiveness in fruit detection. YOLO11m-seg and YOLO11l-seg excelled in non-occluded and occluded fruitlet segmentation with scores of 0.851 and 0.829, respectively. Additionally, YOLO11x-seg led in mask recall for all categories, achieving a score of 0.815, with YOLO11m-seg performing best for non-occluded immature green fruitlets at 0.858 and YOLOv8x-seg leading the occluded category with 0.800. In terms of mean average precision at a 50\% intersection over union (mAP@50), YOLO11m-seg consistently outperformed, registering the highest scores for both box and mask segmentation, at 0.876 and 0.860 for the ‘All’ class and 0.908 and 0.909 for non-occluded immature fruitlets, respectively. YOLO11l-seg and YOLOv8l-seg shared the top box mAP@50 for occluded immature fruitlets at 0.847, while YOLO11m-seg achieved the highest mask mAP@50 of 0.810. Despite the advancements in YOLO11, YOLOv8n surpassed its counterparts in image processing speed, with an impressive inference speed of 3.3 milliseconds, compared to the fastest YOLO11 series model at 4.8 milliseconds, underscoring its suitability for real-time agricultural applications related to complex green fruit environments.

arxiv情報

著者 Ranjan Sapkota,Manoj Karkee
発行日 2024-11-01 16:02:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク