Taxonomy and evolution predicting using deep learning in images

要約

生物学的分類法の重要な部分としての分子的および形態学的特徴は矛盾していますが、統合する必要があります。
生物の画像認識とバイオインフォマティクスは、最近浮上していてホットな問題ですが、それらの間にはギャップがあります。
この作品では、遺伝情報によって媒介されるマルチブランチ認識フレームワークがこの障壁を橋渡しし、キノコのマクロ形態とミクロ分子情報の間のリンクを確立します。
新しい多視点構造は、3つの分岐モデルからの特徴画像を融合するために提案されています。これにより、認識の精度が約10%から最大90%まで大幅に向上します。
さらに、遺伝情報は、画像距離と種の識別を予測するための表現空間として遺伝距離埋め込みを使用することにより、キノコ画像認識タスクに実装されます。
従来の分類タスクのセマンティックな過剰適合と、きめの細かい画像認識の粒度についても、初めて詳細に説明します。
モデルの一般化可能性は、ゼロショット学習タスクを使用してきめ細かいシナリオで調査されました。これにより、目に見えないサンプルの分類学的および進化的情報を予測できます。
画像をDNAにマッピングする最初の方法、つまり画像を遺伝距離にマッピングするエンコーダーを使用し、事前にトレーニングされたデコーダーを介してDNAをデコードする方法を紹介しました。この場合、37種のDNA予測の合計テスト精度は87.45%です。
この研究は、きのこ画像認識問題を体系的に研究し、巨視的な生物学的情報と微視的な分子情報の間のギャップを埋めることによって、新しい認識フレームワークを作成します。これは、将来のインテリジェントバイオメトリクスの新しいリファレンスを提供します。

要約(オリジナル)

Molecular and morphological characters, as important parts of biological taxonomy, are contradictory but need to be integrated. Organism’s image recognition and bioinformatics are emerging and hot problems nowadays but with a gap between them. In this work, a multi-branching recognition framework mediated by genetic information bridges this barrier, which establishes the link between macro-morphology and micro-molecular information of mushrooms. The novel multi-perspective structure is proposed to fuse the feature images from three branching models, which significantly improves the accuracy of recognition by about 10% and up to more than 90%. Further, genetic information is implemented to the mushroom image recognition task by using genetic distance embeddings as the representation space for predicting image distance and species identification. Semantic overfitting of traditional classification tasks and the granularity of fine-grained image recognition are also discussed in depth for the first time. The generalizability of the model was investigated in fine-grained scenarios using zero-shot learning tasks, which could predict the taxonomic and evolutionary information of unseen samples. We presented the first method to map images to DNA, namely used an encoder mapping image to genetic distances, and then decoded DNA through a pre-trained decoder, where the total test accuracy on 37 species for DNA prediction is 87.45%. This study creates a novel recognition framework by systematically studying the mushroom image recognition problem, bridging the gap between macroscopic biological information and microscopic molecular information, which will provide a new reference for intelligent biometrics in the future.

arxiv情報

著者 Jiewen Xiao,Wenbin Liao,Ming Zhang,Jing Wang,Jianxin Wang,Yihua Yang
発行日 2022-06-28 13:54:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク