要約
本論文は、膵管ネットワークのセグメンテーションという難しい課題に動機づけられ、バイオメディカルイメージングにおいて一般的に遭遇する2つの問題に取り組んでいる。すなわち、セグメンテーションの位相的整合性と、高価で困難なアノテーションである。a) モデル選択と検証に適用される、予測されたセグメンテーションとグランドトゥルースの間の位相的・幾何学的整合性の両方を測定する位相的スコアを提案する。 b) 時系列画像データにおけるこの難しいノイズタスクのための完全なディープラーニング手法を提供する。本手法では、まず、一般的なセグメンテーションタスクに適用可能な半教師付きUネットアーキテクチャを用い、オートエンコーダーとセグメンテーションネットワークを共同で学習させる。次に、予測されたトポロジーをさらに改善するために、時間経過に伴うループの追跡を用いる。この半教師付きアプローチにより、注釈付き学習データのばらつきが非常に少ないにもかかわらず、ばらつきの大きいテストデータに対して汎化する特徴表現を学習するために、注釈なしデータを利用することができる。我々は、ノイズの多いライブイメージング共焦点顕微鏡から胎児の膵臓の管状構造を見つけるという難しいセグメンテーションタスクで、その貢献を検証する。我々の半教師付きモデルは、完全教師付きモデルや事前学習済みモデルだけでなく、学習中の位相的一貫性を考慮したアプローチも上回ることを示す。さらに、我々のアプローチは、胎児膵臓のループを検出するための平均ループスコア0.808を達成し、clDiceで学習したU-netの平均ループスコア0.762と比較して、より優れている。
要約(オリジナル)
Motivated by the challenging segmentation task of pancreatic tubular networks, this paper tackles two commonly encountered problems in biomedical imaging: Topological consistency of the segmentation, and expensive or difficult annotation. Our contributions are the following: a) We propose a topological score which measures both topological and geometric consistency between the predicted and ground truth segmentations, applied to model selection and validation. b) We provide a full deep-learning methodology for this difficult noisy task on time-series image data. In our method, we first use a semisupervised U-net architecture, applicable to generic segmentation tasks, which jointly trains an autoencoder and a segmentation network. We then use tracking of loops over time to further improve the predicted topology. This semi-supervised approach allows us to utilize unannotated data to learn feature representations that generalize to test data with high variability, in spite of our annotated training data having very limited variation. Our contributions are validated on a challenging segmentation task, locating tubular structures in the fetal pancreas from noisy live imaging confocal microscopy. We show that our semi-supervised model outperforms not only fully supervised and pre-trained models but also an approach which takes topological consistency into account during training. Further, our approach achieves a mean loop score of 0.808 for detecting loops in the fetal pancreas, compared to a U-net trained with clDice with mean loop score 0.762.
arxiv情報
著者 | Kasra Arnavaz,Oswin Krause,Kilian Zepf,Jelena M. Krivokapic,Silja Heilmann,Jakob Andreas Bærentzen,Pia Nyeng,Aasa Feragen |
発行日 | 2022-07-04 15:12:45+00:00 |
arxivサイト | arxiv_id(pdf) |