要約
最近の医療画像セグメンテーション モデルはほとんどがハイブリッドであり、自己注意層と畳み込み層を非同形アーキテクチャに統合しています。
ただし、これらのアプローチの潜在的な欠点の 1 つは、このハイブリッドな組み合わせ方法が有益である理由の直感的な説明を提供できず、その後の作業でそれらに加えて改善を行うことが困難になることです。
この問題に対処するために、まず自己注意と畳み込みの重み割り当てメカニズムの違いを分析します。
この分析に基づいて、単純な並列化による自己注意と畳み込みの利点を利用する並列非同形ブロックの構築を提案します。
結果として得られる U 字型セグメンテーション モデルを UNet-2022 と名付けます。
実験では、UNet-2022 は、腹部多臓器セグメンテーション、自動心臓診断、神経構造セグメンテーション、皮膚病変セグメンテーションなどの範囲セグメンテーション タスクで対応するものよりも明らかに優れており、最高のベースラインを 4% 上回ることもあります。
具体的には、UNet-2022 は、現在最も認知されているセグメンテーション モデルである nnUNet を大幅に上回っています。
これらの現象は、UNet-2022 が医用画像セグメンテーションの最適なモデルになる可能性を示しています。
要約(オリジナル)
Recent medical image segmentation models are mostly hybrid, which integrate self-attention and convolution layers into the non-isomorphic architecture. However, one potential drawback of these approaches is that they failed to provide an intuitive explanation of why this hybrid combination manner is beneficial, making it difficult for subsequent work to make improvements on top of them. To address this issue, we first analyze the differences between the weight allocation mechanisms of the self-attention and convolution. Based on this analysis, we propose to construct a parallel non-isomorphic block that takes the advantages of self-attention and convolution with simple parallelization. We name the resulting U-shape segmentation model as UNet-2022. In experiments, UNet-2022 obviously outperforms its counterparts in a range segmentation tasks, including abdominal multi-organ segmentation, automatic cardiac diagnosis, neural structures segmentation, and skin lesion segmentation, sometimes surpassing the best performing baseline by 4%. Specifically, UNet-2022 surpasses nnUNet, the most recognized segmentation model at present, by large margins. These phenomena indicate the potential of UNet-2022 to become the model of choice for medical image segmentation.
arxiv情報
著者 | Jiansen Guo,Hong-Yu Zhou,Liansheng Wang,Yizhou Yu |
発行日 | 2022-10-27 16:00:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google