Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes

要約

ディープラーニングは、医療画像のセグメンテーションにおいて大きな注目を集めています。
ただし、アノテーション付きトレーニング データの利用可能性が限られているため、正確な結果を得ることが困難になります。
この課題を克服する取り組みとして、データ拡張技術が提案されています。
ただし、これらのアプローチの大部分は主に画像生成に焦点を当てています。
セグメンテーション タスクでは、画像とそれに対応するターゲット マスクの両方を提供することが重要ですが、特に限られたトレーニング データセットを使用する場合、多様で現実的なサンプルの生成は依然として複雑なタスクです。
この目的を達成するために、生成される画像の品質を向上させるために、ハミルトニアン変分オートエンコーダー (HVAE) と識別正則化に基づく新しいエンドツーエンドのハイブリッド アーキテクチャを提案します。
私たちの方法は、画像とマスクの結合分布を正確に推定し、その結果、アーチファクトや分布外のインスタンスが削減された現実的な医療画像を生成します。
3D ボリュームの生成にはかなりの時間とメモリが必要となるため、当社のアーキテクチャはスライスごとに動作して 3D ボリュームをセグメント化し、豊富に拡張されたデータセットを活用します。
BRATS (MRI モダリティ) と HECKTOR (PET モダリティ) の 2 つの公開データセットで行われた実験は、限られたデータでさまざまな医用画像モダリティに対する提案手法の有効性を示しています。

要約(オリジナル)

Deep learning has gained significant attention in medical image segmentation. However, the limited availability of annotated training data presents a challenge to achieving accurate results. In efforts to overcome this challenge, data augmentation techniques have been proposed. However, the majority of these approaches primarily focus on image generation. For segmentation tasks, providing both images and their corresponding target masks is crucial, and the generation of diverse and realistic samples remains a complex task, especially when working with limited training datasets. To this end, we propose a new end-to-end hybrid architecture based on Hamiltonian Variational Autoencoders (HVAE) and a discriminative regularization to improve the quality of generated images. Our method provides an accuracte estimation of the joint distribution of the images and masks, resulting in the generation of realistic medical images with reduced artifacts and off-distribution instances. As generating 3D volumes requires substantial time and memory, our architecture operates on a slice-by-slice basis to segment 3D volumes, capitilizing on the richly augmented dataset. Experiments conducted on two public datasets, BRATS (MRI modality) and HECKTOR (PET modality), demonstrate the efficacy of our proposed method on different medical imaging modalities with limited data.

arxiv情報

著者 Aghiles Kebaili,Jérôme Lapuyade-Lahorgue,Pierre Vera,Su Ruan
発行日 2024-06-17 15:42:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク