IP-UNet: Intensity Projection UNet Architecture for 3D Medical Volume Segmentation

要約

CNN は医療画像解析に広く応用されています。
ただし、メモリ容量が限られていることが、高解像度 3D ボリュメトリック データを処理する際の最も一般的な欠点の 1 つです。
3D ボリュームは通常、処理の前に最初にトリミングまたはダウンサイズされます。これにより、解像度が失われ、クラスの不均衡が増大し、セグメンテーション アルゴリズムのパフォーマンスに影響を与える可能性があります。
この論文では、IP-UNet と呼ばれるエンドツーエンドの深層学習アプローチを提案します。
IP-UNet は、メモリを消費する 3D ボリュームの代わりに 3D ボリューム データの強度投影 (IP) でマルチクラス セグメンテーションを実行する UNet ベースのモデルです。
IP-UNet は、元の 3D 画像の解像度を失うことなく、限られたメモリ容量を使用してトレーニングを行います。
セグメンテーションの精度と計算コストの観点から 3 つのモデルのパフォーマンスを比較します。 1) 従来の 2D UNet モデルを使用した CT スキャン画像のスライスごとの 2D セグメンテーション。
2) IP-UNet は、ソース 3D ボリュームの抽出された最大強度投影 (MIP)、最近接血管投影 (CVP)、および平均強度投影 (AvgIP) 表現をマージして得られたデータを操作し、出力に UNet モデルを適用します。
IP画像。
3) 3D-UNet モデルは、一連の CT スキャン画像から構築された 3D ボリュームを直接読み取り、予測されたセグメンテーションの 3D ボリュームを出力します。
乳房石灰化の自動検出のために、3D ボリューム画像上でこれらの方法のパフォーマンスをテストします。
実験結果は、IP-Unet が 3D-Unet と同様のセグメンテーション精度を達成できるが、パフォーマンスははるかに優れていることを示しています。
トレーニング時間が 70\%、メモリ消費量が 92\% 削減されます。

要約(オリジナル)

CNNs have been widely applied for medical image analysis. However, limited memory capacity is one of the most common drawbacks of processing high-resolution 3D volumetric data. 3D volumes are usually cropped or downsized first before processing, which can result in a loss of resolution, increase class imbalance, and affect the performance of the segmentation algorithms. In this paper, we propose an end-to-end deep learning approach called IP-UNet. IP-UNet is a UNet-based model that performs multi-class segmentation on Intensity Projection (IP) of 3D volumetric data instead of the memory-consuming 3D volumes. IP-UNet uses limited memory capability for training without losing the original 3D image resolution. We compare the performance of three models in terms of segmentation accuracy and computational cost: 1) Slice-by-slice 2D segmentation of the CT scan images using a conventional 2D UNet model. 2) IP-UNet that operates on data obtained by merging the extracted Maximum Intensity Projection (MIP), Closest Vessel Projection (CVP), and Average Intensity Projection (AvgIP) representations of the source 3D volumes, then applying the UNet model on the output IP images. 3) 3D-UNet model directly reads the 3D volumes constructed from a series of CT scan images and outputs the 3D volume of the predicted segmentation. We test the performance of these methods on 3D volumetric images for automatic breast calcification detection. Experimental results show that IP-Unet can achieve similar segmentation accuracy with 3D-Unet but with much better performance. It reduces the training time by 70\% and memory consumption by 92\%.

arxiv情報

著者 Nyothiri Aung,Tahar Kechadi,Liming Chen,Sahraoui Dhelim
発行日 2023-08-24 13:08:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク