SCUNet++: Assessment of Pulmonary Embolism CT Image Segmentation Leveraging Swin-UNet and CNN Bottleneck Hybrid Architecture with Multi-Fusion Dense Skip Connection

要約

肺塞栓症 (PE) は、重篤な場合には右心室肥大や機能不全を引き起こす可能性がある一般的な肺疾患であり、重症度では心筋梗塞や突然死に次ぐ第 2 位にランクされます。
肺動脈 CT 血管造影 (CTPA) は、PE の診断方法として広く使用されています。
ただし、イメージング技術の限界により、臨床現場では PE の検出に課題が生じています。
CTPA は PE と同様のノイズを発生する可能性があるため、その存在の確認に時間がかかり、過剰診断が行われやすくなります。
それにもかかわらず、PEの従来のセグメンテーション方法では、PE CT画像の特徴の階層構造、局所的および大域的な空間的特徴を完全に考慮することができません。
本稿では、SCUNet++ (Swin Conv UNet++) と呼ばれる自動 PE セグメンテーション手法を提案します。
この方法には、エンコーダとして Swin Transformer を利用して、エンコーダとデコーダの間に複数のフュージョン デンス スキップ接続が組み込まれています。
また、デコーダ サブネットワーク内のさまざまなスケールの機能を融合して、Swin-UNet またはその他の最先端の方法で避けられないダウンサンプリングによって引き起こされる空間情報損失を補償し、上記の問題を効果的に解決します。
この方法の理論的分析を詳細に提供し、公的に利用可能な PE CT 画像データセット FUMPE および CAD-PE で検証します。
実験結果は、私たちが提案した方法が、FUMPE データセットで 83.47% の Dice 類似性係数 (DSC) と 3.83 のハウスドルフ距離 95 パーセンタイル (HD95) を達成したこと、および FUMPE データセットで 83.42% の DSC と 5.10 の HD95 を達成したことを示しています
CAD-PE データセット。
これらの発見は、私たちの方法がPEセグメンテーションタスクで強力なパフォーマンスを示し、PEの自動セグメンテーションの精度を向上させ、臨床医師に強力な診断ツールを提供する可能性があることを示しています。
私たちのソース コードと新しい FUMPE データセットは、https://github.com/JustlfC03/SCUNet-plusplus で入手できます。

要約(オリジナル)

Pulmonary embolism (PE) is a prevalent lung disease that can lead to right ventricular hypertrophy and failure in severe cases, ranking second in severity only to myocardial infarction and sudden death. Pulmonary artery CT angiography (CTPA) is a widely used diagnostic method for PE. However, PE detection presents challenges in clinical practice due to limitations in imaging technology. CTPA can produce noises similar to PE, making confirmation of its presence time-consuming and prone to overdiagnosis. Nevertheless, the traditional segmentation method of PE can not fully consider the hierarchical structure of features, local and global spatial features of PE CT images. In this paper, we propose an automatic PE segmentation method called SCUNet++ (Swin Conv UNet++). This method incorporates multiple fusion dense skip connections between the encoder and decoder, utilizing the Swin Transformer as the encoder. And fuses features of different scales in the decoder subnetwork to compensate for spatial information loss caused by the inevitable downsampling in Swin-UNet or other state-of-the-art methods, effectively solving the above problem. We provide a theoretical analysis of this method in detail and validate it on publicly available PE CT image datasets FUMPE and CAD-PE. The experimental results indicate that our proposed method achieved a Dice similarity coefficient (DSC) of 83.47% and a Hausdorff distance 95th percentile (HD95) of 3.83 on the FUMPE dataset, as well as a DSC of 83.42% and an HD95 of 5.10 on the CAD-PE dataset. These findings demonstrate that our method exhibits strong performance in PE segmentation tasks, potentially enhancing the accuracy of automatic segmentation of PE and providing a powerful diagnostic tool for clinical physicians. Our source code and new FUMPE dataset are available at https://github.com/JustlfC03/SCUNet-plusplus.

arxiv情報

著者 Yifei Chen,Binfeng Zou,Zhaoxin Guo,Yiyu Huang,Yifan Huang,Feiwei Qin,Qinhai Li,Changmiao Wang
発行日 2023-12-22 14:06:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク