Mushroom image recognition and distance generation based on attention-mechanism model and genetic information

要約

Macrofungi、つまりキノコの種の識別は、常に困難な作業でした。
まだ発見されていない毒キノコがたくさんあり、人命にかかわる危険があります。
しかし、従来の識別方法では、手動識別のために分類法の分野の知識を持つ多数の専門家が必要であり、非効率的であるだけでなく、多くの人件費と資本コストを消費します。
本論文では、注意機構に基づく新しいモデルであるMushroomNetを提案します。これは、軽量ネットワークMobileNetV3をバックボーンモデルとして適用し、私たちが提案した注意構造と組み合わせて、きのこ認識タスクで優れたパフォーマンスを実現しました。
パブリックデータセットでは、MushroomNetモデルのテスト精度は83.9%に達し、ローカルデータセットでは、テスト精度は77.4%に達しました。
提案された注意メカニズムは、混合チャネル注意のためのキノコ画像の本体と、Grad-CAMによって視覚化された注意ヒートマップに注意を集中させました。
さらに、この研究では、遺伝距離をキノコ画像認識タスクに追加し、遺伝距離を表現空間として使用し、データセット内のキノコ種の各ペア間の遺伝距離を遺伝距離表現の埋め込みとして使用しました。
画像の距離と種を予測するための空間。
識別。
MES活性化関数を使用すると、きのこの遺伝距離を非常によく予測できますが、精度はSoftMaxよりも低くなります。
提案されたMushroomNetは、自動およびオンラインのキノコ画像の大きな可能性を示しており、提案された自動手順は、従来のキノコ分類を支援し、参照するものであることが実証されました。

要約(オリジナル)

The species identification of Macrofungi, i.e. mushrooms, has always been a challenging task. There are still a large number of poisonous mushrooms that have not been found, which poses a risk to people’s life. However, the traditional identification method requires a large number of experts with knowledge in the field of taxonomy for manual identification, it is not only inefficient but also consumes a lot of manpower and capital costs. In this paper, we propose a new model based on attention-mechanism, MushroomNet, which applies the lightweight network MobileNetV3 as the backbone model, combined with the attention structure proposed by us, and has achieved excellent performance in the mushroom recognition task. On the public dataset, the test accuracy of the MushroomNet model has reached 83.9%, and on the local dataset, the test accuracy has reached 77.4%. The proposed attention mechanisms well focused attention on the bodies of mushroom image for mixed channel attention and the attention heat maps visualized by Grad-CAM. Further, in this study, genetic distance was added to the mushroom image recognition task, the genetic distance was used as the representation space, and the genetic distance between each pair of mushroom species in the dataset was used as the embedding of the genetic distance representation space, so as to predict the image distance and species. identify. We found that using the MES activation function can predict the genetic distance of mushrooms very well, but the accuracy is lower than that of SoftMax. The proposed MushroomNet was demonstrated it shows great potential for automatic and online mushroom image and the proposed automatic procedure would assist and be a reference to traditional mushroom classification.

arxiv情報

著者 Wenbin Liao,Jiewen Xiao,Chengbo Zhao,Yonggong Han,ZhiJie Geng,Jianxin Wang,Yihua Yang
発行日 2022-06-27 15:43:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク