TomatoDIFF: On-plant Tomato Segmentation with Denoising Diffusion Models

要約

人工知能アプリケーションにより、農家はコストと環境への影響を削減しながら作物の成長と生産を最適化できます。
特にコンピューター ビジョン ベースのアルゴリズムは果物のセグメンテーションによく使用され、収穫品質の詳細な分析と正確な収量推定を可能にします。
この論文では、植物上のトマトのセマンティック セグメンテーションのための新しい拡散ベースのモデル TomatoDIFF を提案します。
他の競合手法と比較して評価した場合、私たちのモデルは、果実が高度に閉塞されている困難な環境であっても、最先端 (SOTA) のパフォーマンスを実証します。
さらに、温室トマトの新しい大規模かつ挑戦的なデータセットであるトマトピアを紹介します。
データセットは、高解像度の RGB-D 画像と果物のピクセルレベルの注釈で構成されています。

要約(オリジナル)

Artificial intelligence applications enable farmers to optimize crop growth and production while reducing costs and environmental impact. Computer vision-based algorithms in particular, are commonly used for fruit segmentation, enabling in-depth analysis of the harvest quality and accurate yield estimation. In this paper, we propose TomatoDIFF, a novel diffusion-based model for semantic segmentation of on-plant tomatoes. When evaluated against other competitive methods, our model demonstrates state-of-the-art (SOTA) performance, even in challenging environments with highly occluded fruits. Additionally, we introduce Tomatopia, a new, large and challenging dataset of greenhouse tomatoes. The dataset comprises high-resolution RGB-D images and pixel-level annotations of the fruits.

arxiv情報

著者 Marija Ivanovska,Vitomir Struc,Janez Pers
発行日 2023-07-03 14:43:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク