Leveraging Global Binary Masks for Structure Segmentation in Medical Images

要約

医用画像セグメンテーション用の深層学習 (DL) モデルは、入力画像の強度変化に大きく影響され、主にピクセルの強度情報を推論に利用するため一般化が欠けています。
十分なトレーニング データを取得することは、モデルのアプリケーションを制限するもう 1 つの課題です。
私たちは、医用画像における臓器の解剖学的形状と位置情報の一貫性を活用することを提案しました。
私たちは、臓器セグメンテーションのためのグローバル バイナリ マスクを介して反復的な解剖学的パターンを活用するフレームワークを導入しました。
2 つのシナリオが検討されました。1) グローバル バイナリ マスクが唯一のモデル (つまり U-Net) の入力であり、セグメンテーション/ローカリゼーションのために器官の位置と形状情報を排他的にエンコードすることを強制しました。2) グローバル バイナリ マスクは、位置として機能する追加のチャネルとして組み込まれました。
/shape トレーニング データの不足を軽減する手がかり。
脳と心臓の CT 画像とそのグラウンドトゥルースの 2 つのデータセットは、それぞれトレーニング、検証、テストのために (26:10:10) と (12:3:5) に分割されました。
グローバル バイナリ マスクのみを使用したトレーニングにより、Dice スコアは 0.77(0.06) および 0.85(0.04) となり、グラウンド トゥルースの質量中心に対する平均ユークリッド距離は 3.12(1.43) mm および 2.5(0.93) mm となりました。
それぞれ脳と心臓の構造。
この結果は、驚くべき程度の位置および形状情報がグローバル バイナリ マスクを通じてエンコードされていることを示しています。
グローバル バイナリ マスクを組み込むと、トレーニング データの小さなサブセット内の CT 画像のみでトレーニングされたモデルと比較して、精度が大幅に向上しました。
脳と心臓のデータセットの 1 ~ 8 トレーニング ケースでは、パフォーマンスがそれぞれ 4.3 ~ 125.3% および 1.3 ~ 48.1% 向上しました。
この調査結果は、一般化可能なモデルを構築し、トレーニング データの不足を補うためにグローバル バイナリ マスクを利用する利点を示唆しています。

要約(オリジナル)

Deep learning (DL) models for medical image segmentation are highly influenced by intensity variations of input images and lack generalization due to primarily utilizing pixels’ intensity information for inference. Acquiring sufficient training data is another challenge limiting models’ applications. We proposed to leverage the consistency of organs’ anatomical shape and position information in medical images. We introduced a framework leveraging recurring anatomical patterns through global binary masks for organ segmentation. Two scenarios were studied.1) Global binary masks were the only model’s (i.e. U-Net) input, forcing exclusively encoding organs’ position and shape information for segmentation/localization.2) Global binary masks were incorporated as an additional channel functioning as position/shape clues to mitigate training data scarcity. Two datasets of the brain and heart CT images with their ground-truth were split into (26:10:10) and (12:3:5) for training, validation, and test respectively. Training exclusively on global binary masks led to Dice scores of 0.77(0.06) and 0.85(0.04), with the average Euclidian distance of 3.12(1.43)mm and 2.5(0.93)mm relative to the center of mass of the ground truth for the brain and heart structures respectively. The outcomes indicate that a surprising degree of position and shape information is encoded through global binary masks. Incorporating global binary masks led to significantly higher accuracy relative to the model trained on only CT images in small subsets of training data; the performance improved by 4.3-125.3% and 1.3-48.1% for 1-8 training cases of the brain and heart datasets respectively. The findings imply the advantages of utilizing global binary masks for building generalizable models and to compensate for training data scarcity.

arxiv情報

著者 Mahdieh Kazemimoghadam,Zi Yang,Lin Ma,Mingli Chen,Weiguo Lu,Xuejun Gu
発行日 2023-08-24 15:00:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, eess.IV パーマリンク