J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation

要約

医療画像のセグメンテーションは、診断と治療計画に不可欠です。
U-Net などの従来の CNN ベースのモデルは有望な結果を示していますが、長距離の依存関係やグローバル コンテキストを捉えるのに苦労しています。
これらの制限に対処するために、チャネル アテンションとピラミッド アテンションのメカニズムを共同適用して、マルチスケールの特徴抽出を改善し、医療画像のセグメンテーションのパフォーマンスを向上させるトランスフォーマー ベースのアーキテクチャを提案します。
モデルの複雑さが増すと、より多くのトレーニング データが必要になるため、CutMix データ拡張によりモデルの一般化がさらに向上します。
私たちのアプローチは Synapse 多臓器セグメンテーション データセットで評価され、機能強化を行わない実装と比較して、平均ダイス スコアで 6.9% の改善、ハウスドルフ距離 (HD95) で 39.9% の改善を達成しました。
私たちが提案したモデルは、複雑な解剖学的構造のセグメンテーション精度が向上し、既存の最先端の方法を上回るパフォーマンスを示しています。

要約(オリジナル)

Medical image segmentation is crucial for diagnosis and treatment planning. Traditional CNN-based models, like U-Net, have shown promising results but struggle to capture long-range dependencies and global context. To address these limitations, we propose a transformer-based architecture that jointly applies Channel Attention and Pyramid Attention mechanisms to improve multi-scale feature extraction and enhance segmentation performance for medical images. Increasing model complexity requires more training data, and we further improve model generalization with CutMix data augmentation. Our approach is evaluated on the Synapse multi-organ segmentation dataset, achieving a 6.9% improvement in Mean Dice score and a 39.9% improvement in Hausdorff Distance (HD95) over an implementation without our enhancements. Our proposed model demonstrates improved segmentation accuracy for complex anatomical structures, outperforming existing state-of-the-art methods.

arxiv情報

著者 Marzia Binta Nizam,Marian Zlateva,James Davis
発行日 2024-11-25 16:52:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク