要約
U 字型の構造に基づくモデルにより、医用画像のセグメンテーションのパフォーマンスが向上しました。
ただし、U-Net の単層デコーダ構造は「薄すぎる」ため、十分な情報を利用できず、その結果、エンコーダ部分とデコーダ部分の間に大きな意味上の違いが生じます。
データのトレーニング セットの数が十分に大きくない場合、状況はさらに悪化します。これは、注釈付きデータの取得が他のタスクよりも難しい医療画像処理タスクでは一般的です。
この観察に基づいて、この研究では医療画像セグメンテーション タスク用に MS-UNet という名前の新しい U-Net モデルを提案します。
Swin-UNet および TransUnet で使用される単層 U-Net デコーダ構造の代わりに、U-Net 用の Swin Transformer に基づいてマルチスケールのネストされたデコーダを特別に設計します。
提案されたマルチスケールのネストされたデコーダ構造により、デコーダとエンコーダの間の特徴マッピングが意味的に緊密になるため、ネットワークがより詳細な特徴を学習できるようになります。
さらに、新しいエッジ損失とプラグアンドプレイ微調整ノイズ除去モジュールを提案します。これは、MS-UNet のセグメンテーション パフォーマンスを効果的に向上させるだけでなく、他のモデルにも個別に適用できます。
実験結果は、MS-UNet がより効率的な特徴学習機能によってネットワーク パフォーマンスを効果的に向上させ、特にトレーニング データが少ない極端な場合に、より高度なパフォーマンスを発揮できること、および提案されたエッジ損失およびノイズ除去モジュールによりネットワーク パフォーマンスを大幅に向上できることを示しています。
MS-UNet のセグメンテーション パフォーマンス。
要約(オリジナル)
Models based on U-like structures have improved the performance of medical image segmentation. However, the single-layer decoder structure of U-Net is too ‘thin’ to exploit enough information, resulting in large semantic differences between the encoder and decoder parts. Things get worse if the number of training sets of data is not sufficiently large, which is common in medical image processing tasks where annotated data are more difficult to obtain than other tasks. Based on this observation, we propose a novel U-Net model named MS-UNet for the medical image segmentation task in this study. Instead of the single-layer U-Net decoder structure used in Swin-UNet and TransUnet, we specifically design a multi-scale nested decoder based on the Swin Transformer for U-Net. The proposed multi-scale nested decoder structure allows the feature mapping between the decoder and encoder to be semantically closer, thus enabling the network to learn more detailed features. In addition, we propose a novel edge loss and a plug-and-play fine-tuning Denoising module, which not only effectively improves the segmentation performance of MS-UNet, but could also be applied to other models individually. Experimental results show that MS-UNet could effectively improve the network performance with more efficient feature learning capability and exhibit more advanced performance, especially in the extreme case with a small amount of training data, and the proposed Edge loss and Denoising module could significantly enhance the segmentation performance of MS-UNet.
arxiv情報
著者 | Haoyuan Chen,Yufei Han,Pin Xu,Yanyi Li,Kuan Li,Jianping Yin |
発行日 | 2023-09-07 13:00:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google