Few-Shot Learning Enables Population-Scale Analysis of Leaf Traits in Populus trichocarpa

要約

植物の表現型解析は通常、時間と費用がかかる作業であり、生物学的に関連する植物の形質を細心の注意を払って測定するために大規模な研究者グループが必要であり、個体群規模での植物の適応と複雑な形質の根底にある遺伝的構造を理解する上での主なボトルネックです。
この作業では、畳み込みニューラル ネットワーク (CNN) を使用した少数ショット学習を活用して、現場で取得した 2,906 個の P. trichocarpa の葉画像の葉体と目に見える葉脈をセグメント化することで、これらの課題に対処します。
以前の方法とは対照的に、私たちのアプローチは、(i) 実験や画像の前処理を必要とせず、(ii) フル解像度で未加工の RGB 画像を使用し、(iii) トレーニングに必要なサンプルはごくわずかです (たとえば、
静脈セグメンテーション)。
葉の形態と葉脈のトポロジーに関連する形質は、従来のオープンソースの画像処理ツールを使用して得られたセグメンテーションから抽出され、実世界の物理測定を使用して検証され、形質を制御する遺伝子を特定するためのゲノムワイドな関連研究の実施に使用されます。
このように、現在の作業は、植物表現型コミュニティに (i) 最小限のトレーニング データを必要とする高速かつ正確な画像ベースの特徴抽出の方法、および (ii) 68 の異なるデータを含む新しい人口規模のデータ セットを提供するように設計されています。
葉の表現型、ドメイン サイエンティストおよび機械学習研究者向け。
数回の学習コード、データ、および結果はすべて公開されています。

要約(オリジナル)

Plant phenotyping is typically a time-consuming and expensive endeavor, requiring large groups of researchers to meticulously measure biologically relevant plant traits, and is the main bottleneck in understanding plant adaptation and the genetic architecture underlying complex traits at population scale. In this work, we address these challenges by leveraging few-shot learning with convolutional neural networks (CNNs) to segment the leaf body and visible venation of 2,906 P. trichocarpa leaf images obtained in the field. In contrast to previous methods, our approach (i) does not require experimental or image pre-processing, (ii) uses the raw RGB images at full resolution, and (iii) requires very few samples for training (e.g., just eight images for vein segmentation). Traits relating to leaf morphology and vein topology are extracted from the resulting segmentations using traditional open-source image-processing tools, validated using real-world physical measurements, and used to conduct a genome-wide association study to identify genes controlling the traits. In this way, the current work is designed to provide the plant phenotyping community with (i) methods for fast and accurate image-based feature extraction that require minimal training data, and (ii) a new population-scale data set, including 68 different leaf phenotypes, for domain scientists and machine learning researchers. All of the few-shot learning code, data, and results are made publicly available.

arxiv情報

著者 John Lagergren,Mirko Pavicic,Hari B. Chhetri,Larry M. York,P. Doug Hyatt,David Kainer,Erica M. Rutter,Kevin Flores,Gail Taylor,Daniel Jacobson,Jared Streich
発行日 2023-01-24 23:40:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, q-bio.QM パーマリンク