RAFA-Net: Region Attention Network For Food Items And Agricultural Stress Recognition

要約

深層畳み込みニューラル ネットワーク (CNN) は、さまざまな食品や農業ストレスの認識において目覚ましい成功を収めてきました。
地域ベースの部分特徴記述子のマイニングと分析により、農産物の課題を解決する際に、かなりのパフォーマンスの向上が確認されています。
また、複数の CNN を使用した計算コストの高いアンサンブル学習スキームが以前の研究で研究されています。
この研究では、入力画像内の異なる領域間の相関関係を構築することにより、長距離依存関係をモデル化するための領域注意スキームを提案しています。
アテンション法は、相補的な領域からコンテキスト情報の有用性を学習することで特徴表現を強化します。
空間ピラミッド型プーリングと平均プーリング ペアは、部分的な記述子を全体的な表現に集約します。
どちらのプーリング方法も、追加のパラメーターを発生させることなく、空間的およびチャネルに関する関係を確立します。
コンテキスト ゲーティング スキームを適用して、分類に関連する重み付けされた注意特徴の記述性を洗練します。
RAFA-Net と呼ばれる、食品および農業ストレス認識手法のための提案された地域アテンション ネットワークは、3 つの公共食品データセットで実験され、明確なマージンを備えた最先端のパフォーマンスを達成しました。
RAFA-Net のトップ 1 の最高精度は、UECFood-100、UECFood-256、MAFood-121 データセットでそれぞれ 91.69%、91.56%、96.97% です。
さらに、2 つのベンチマーク農業ストレス データセットでより高い精度が達成されました。
Insect Pest (IP-102) および PlantDoc-27 植物病データセットにおける最高のトップ 1 精度は、それぞれ 92.36% と 85.54% です。
これは RAFA-Net の汎用化機能を暗示しています。

要約(オリジナル)

Deep Convolutional Neural Networks (CNNs) have facilitated remarkable success in recognizing various food items and agricultural stress. A decent performance boost has been witnessed in solving the agro-food challenges by mining and analyzing of region-based partial feature descriptors. Also, computationally expensive ensemble learning schemes using multiple CNNs have been studied in earlier works. This work proposes a region attention scheme for modelling long-range dependencies by building a correlation among different regions within an input image. The attention method enhances feature representation by learning the usefulness of context information from complementary regions. Spatial pyramidal pooling and average pooling pair aggregate partial descriptors into a holistic representation. Both pooling methods establish spatial and channel-wise relationships without incurring extra parameters. A context gating scheme is applied to refine the descriptiveness of weighted attentional features, which is relevant for classification. The proposed Region Attention network for Food items and Agricultural stress recognition method, dubbed RAFA-Net, has been experimented on three public food datasets, and has achieved state-of-the-art performances with distinct margins. The highest top-1 accuracies of RAFA-Net are 91.69%, 91.56%, and 96.97% on the UECFood-100, UECFood-256, and MAFood-121 datasets, respectively. In addition, better accuracies have been achieved on two benchmark agricultural stress datasets. The best top-1 accuracies on the Insect Pest (IP-102) and PlantDoc-27 plant disease datasets are 92.36%, and 85.54%, respectively; implying RAFA-Net’s generalization capability.

arxiv情報

著者 Asish Bera,Ondrej Krejcar,Debotosh Bhattacharjee
発行日 2024-10-16 16:28:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク