SD-LayerNet: Semi-supervised retinal layer segmentation in OCT using disentangled representation with anatomical priors

要約

光コヒーレンス・トモグラフィー(OCT)は、眼科で網膜の画像診断に広く用いられている非侵襲的な3Dモダリティです。加齢黄斑変性症(AMD)や糖尿病性網膜症などの様々な網膜疾患の検出やモニタリングには、OCT上で解剖学的にコヒーレントな網膜層の自動セグメンテーションを実現することが重要です。しかし、最先端のレイヤーセグメンテーション手法の大半は、純粋に教師付きディープラーニングに基づいており、高価で入手困難な大量のピクセルレベルのアノテーションデータを必要とします。このことを念頭に置いて、我々は、大規模な非ラベル化データセットに存在する情報と解剖学的プリオールを利用する半教師付きパラダイムを網膜層セグメンテーションタスクに導入する。特に、表面位置の回帰をピクセル単位の構造化セグメンテーションに変換するために、新しい完全微分可能なアプローチを用い、モデルを学習するために、1次元表面と2次元層表現の両方を結合的に用いることを可能にする。特に、これらの2次元セグメンテーションは解剖学的因子として用いられ、学習されたスタイル因子と共に、入力画像を再構成するために用いられる分離された表現を構成する。これと並行して、限られた量のラベル付きデータしか利用できない場合に、ネットワーク学習を改善するための解剖学的プリオーのセットを提案する。我々は、中等度及びウェットAMDのスキャンという実世界のデータセットにおいて、我々の手法が、我々の訓練セットを全て使用した場合には最先端技術を上回り、さらに重要なことに、ラベル付きデータの一部で訓練した場合には最先端技術を大きく上回ることを実証する。

要約(オリジナル)

Optical coherence tomography (OCT) is a non-invasive 3D modality widely used in ophthalmology for imaging the retina. Achieving automated, anatomically coherent retinal layer segmentation on OCT is important for the detection and monitoring of different retinal diseases, like Age-related Macular Disease (AMD) or Diabetic Retinopathy. However, the majority of state-of-the-art layer segmentation methods are based on purely supervised deep-learning, requiring a large amount of pixel-level annotated data that is expensive and hard to obtain. With this in mind, we introduce a semi-supervised paradigm into the retinal layer segmentation task that makes use of the information present in large-scale unlabeled datasets as well as anatomical priors. In particular, a novel fully differentiable approach is used for converting surface position regression into a pixel-wise structured segmentation, allowing to use both 1D surface and 2D layer representations in a coupled fashion to train the model. In particular, these 2D segmentations are used as anatomical factors that, together with learned style factors, compose disentangled representations used for reconstructing the input image. In parallel, we propose a set of anatomical priors to improve network training when a limited amount of labeled data is available. We demonstrate on the real-world dataset of scans with intermediate and wet-AMD that our method outperforms state-of-the-art when using our full training set, but more importantly largely exceeds state-of-the-art when it is trained with a fraction of the labeled data.

arxiv情報

著者 Botond Fazekas,Guilherme Aresta,Dmitrii Lachinov,Sophie Riedl,Julia Mai,Ursula Schmidt-Erfurth,Hrvoje Bogunovic
発行日 2022-07-01 14:30:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク