Segmentation of Parotid Gland Tumors Using Multimodal MRI and Contrastive Learning

要約

耳下腺腫瘍は、一般的なタイプの頭頸部腫瘍です。
MR 画像による耳下腺と腫瘍のセグメンテーションは、耳下腺腫瘍の治療に重要です。
ただし、耳下腺のセグメンテーションは、形状が可変であり、周囲の構造とのコントラストが低いため、特に困難です。
近年、複雑な問題を処理できる深層学習が急速に発展しています。
ただし、医療画像を処理するための現在の深層学習手法のほとんどは、依然として教師あり学習に基づいています。
自然画像と比較して、医療画像は取得が難しく、ラベル付けにコストがかかります。
教師なし学習方法としての対照学習は、ラベルのない医療画像をより効果的に利用できます。
この論文では、Transformer ベースの対照学習法を使用し、転移学習を使用して対照学習ネットワークを革新的にトレーニングしました。
次に、出力モデルは下流の耳下腺セグメンテーション タスクに転送され、テスト セットでの耳下腺セグメンテーション モデルのパフォーマンスが向上しました。
改善された DSC は 89.60%、MPA は 99.36%、MIoU は 85.11%、HD は 2.98 でした。
4 つの指標はすべて、教師あり学習モデルを耳下腺セグメンテーション ネットワークの事前トレーニング済みモデルとして使用した結果と比較して、大幅な改善を示しました。
さらに、対照学習モデルによるセグメンテーション ネットワークの改善は、主にエンコーダ部分にあることがわかったため、この論文では、デコーダ部分の対照学習ネットワークの構築も試み、構築の過程で発生した問題について説明しました。

要約(オリジナル)

Parotid gland tumor is a common type of head and neck tumor. Segmentation of the parotid glands and tumors by MR images is important for the treatment of parotid gland tumors. However, segmentation of the parotid glands is particularly challenging due to their variable shape and low contrast with surrounding structures. Recently deep learning has developed rapidly, which can handle complex problems. However, most of the current deep learning methods for processing medical images are still based on supervised learning. Compared with natural images, medical images are difficult to acquire and costly to label. Contrastive learning, as an unsupervised learning method, can more effectively utilize unlabeled medical images. In this paper, we used a Transformer-based contrastive learning method and innovatively trained the contrastive learning network with transfer learning. Then, the output model was transferred to the downstream parotid segmentation task, which improved the performance of the parotid segmentation model on the test set. The improved DSC was 89.60%, MPA was 99.36%, MIoU was 85.11%, and HD was 2.98. All four metrics showed significant improvement compared to the results of using a supervised learning model as a pre-trained model for the parotid segmentation network. In addition, we found that the improvement of the segmentation network by the contrastive learning model was mainly in the encoder part, so this paper also tried to build a contrastive learning network for the decoder part and discussed the problems encountered in the process of building.

arxiv情報

著者 Zi’an Xu,Yin Dai,Fayu Liu,Boyuan Wu,Weibing Chen,Lifu Shi
発行日 2022-12-26 14:28:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク