Tomato Maturity Recognition with Convolutional Transformers

要約

トマトは世界中の主要作物であり、その成熟度を正確に分類することは、収穫、等級分け、品質管理などの多くの農業用途にとって重要です。
この論文では、著者らは畳み込み変換器を使用したトマトの成熟度分類のための新しい方法を提案します。
畳み込みトランスフォーマーは、畳み込みニューラル ネットワーク (CNN) とトランスフォーマーの長所を組み合わせたハイブリッド アーキテクチャです。
さらに、この研究では、トマトのセグメンテーションと分類のための深層学習モデルをトレーニングするために明示的に設計された、KUTomaData という名前の新しいトマト データセットを導入しています。
KUTomaData は、UAE の温室から取得した画像を編集したもので、トレーニングとテストに使用できる約 700 枚の画像が含まれています。
このデータセットは、さまざまな照明条件や視点で作成され、さまざまなモバイル カメラ センサーを採用しているため、既存のデータセットとは区別されます。
この論文の貢献は 3 つあります。まず、著者らはモジュール畳み込み変換器を使用したトマトの成熟度分類のための新しい方法を提案します。
次に、著者らは、さまざまな成熟レベルのトマトの画像を含む新しいトマト画像データセットを導入します。
最後に、著者らは、畳み込み変換器がトマトの成熟度分類に関して最先端の方法よりも優れていることを示しています。
乱雑で隠れたトマト インスタンスの処理における提案されたフレームワークの有効性は、2 つの追加の公開データセットである Laboro Tomato と Rob2Pheno Annotated Tomato をベンチマークとして使用して評価されました。
これら 3 つのデータセットにわたる評価結果は、KUTomaData、Laboro Tomato、および Rob2Pheno の平均平均精度スコアに関して、最先端のフレームワークを 58.14%、65.42%、および 66.39% 上回っており、提案したフレームワークの優れたパフォーマンスを示しています。
それぞれ注釈付きのトマト。

要約(オリジナル)

Tomatoes are a major crop worldwide, and accurately classifying their maturity is important for many agricultural applications, such as harvesting, grading, and quality control. In this paper, the authors propose a novel method for tomato maturity classification using a convolutional transformer. The convolutional transformer is a hybrid architecture that combines the strengths of convolutional neural networks (CNNs) and transformers. Additionally, this study introduces a new tomato dataset named KUTomaData, explicitly designed to train deep-learning models for tomato segmentation and classification. KUTomaData is a compilation of images sourced from a greenhouse in the UAE, with approximately 700 images available for training and testing. The dataset is prepared under various lighting conditions and viewing perspectives and employs different mobile camera sensors, distinguishing it from existing datasets. The contributions of this paper are threefold:Firstly, the authors propose a novel method for tomato maturity classification using a modular convolutional transformer. Secondly, the authors introduce a new tomato image dataset that contains images of tomatoes at different maturity levels. Lastly, the authors show that the convolutional transformer outperforms state-of-the-art methods for tomato maturity classification. The effectiveness of the proposed framework in handling cluttered and occluded tomato instances was evaluated using two additional public datasets, Laboro Tomato and Rob2Pheno Annotated Tomato, as benchmarks. The evaluation results across these three datasets demonstrate the exceptional performance of our proposed framework, surpassing the state-of-the-art by 58.14%, 65.42%, and 66.39% in terms of mean average precision scores for KUTomaData, Laboro Tomato, and Rob2Pheno Annotated Tomato, respectively.

arxiv情報

著者 Asim Khan,Taimur Hassan,Muhammad Shafay,Israa Fahmy,Naoufel Werghi,Lakmal Seneviratne,Irfan Hussain
発行日 2024-01-02 13:13:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク