Y-Net: A Spatiospectral Dual-Encoder Networkfor Medical Image Segmentation

要約

網膜光コヒーレンストモグラフィー(OCT)画像の自動セグメンテーションは、医療アプリケーションの機械学習における重要な最近の方向性になっています。
層の解剖学的構造とOCT画像の高周波変動により、網膜OCTがスペクトル領域の特徴を抽出し、それらを空間領域の特徴と組み合わせるのに適した選択肢になると仮定します。
この作業では、周波数ドメイン機能と画像ドメインを組み合わせてOCT画像のセグメンテーションパフォーマンスを向上させるアーキテクチャである$ \ Upsilon$-Netを紹介します。
この作業の結果は、2つのブランチ(1つはスペクトル機能用、もう1つは空間ドメイン機能用)の導入により、流体セグメンテーションのパフォーマンスが大幅に向上し、よく知られているU-Netモデルと比較してアウトパフォーマンスが可能になることを示しています。
私たちの改善は、流体セグメンテーションダイススコアで13%、平均ダイススコアで1.9%でした。
最後に、スペクトル領域で選択した周波数範囲を削除すると、これらの機能が流体セグメンテーションのアウトパフォーマンスに与える影響がわかります。

要約(オリジナル)

Automated segmentation of retinal optical coherence tomography (OCT) images has become an important recent direction in machine learning for medical applications. We hypothesize that the anatomic structure of layers and their high-frequency variation in OCT images make retinal OCT a fitting choice for extracting spectral-domain features and combining them with spatial domain features. In this work, we present $\Upsilon$-Net, an architecture that combines the frequency domain features with the image domain to improve the segmentation performance of OCT images. The results of this work demonstrate that the introduction of two branches, one for spectral and one for spatial domain features, brings a very significant improvement in fluid segmentation performance and allows outperformance as compared to the well-known U-Net model. Our improvement was 13% on the fluid segmentation dice score and 1.9% on the average dice score. Finally, removing selected frequency ranges in the spectral domain demonstrates the impact of these features on the fluid segmentation outperformance.

arxiv情報

著者 Azade Farshad,Yousef Yeganeh,Peter Gehlbach,Nassir Navab
発行日 2022-07-07 16:44:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク