3D Lymphoma Segmentation on PET/CT Images via Multi-Scale Information Fusion with Cross-Attention

要約

背景: びまん性大細胞型 B 細胞リンパ腫 (DLBCL) 病変の正確なセグメンテーションは、医療画像における複雑なパターンのため困難です。
目的: この研究は、18F-フルオロデオキシグルコース (FDG) 陽電子放出断層撮影 (PET) およびコンピュータ断層撮影 (CT) 画像を使用して、DLBCL の正確なセグメンテーション方法を開発することを目的としています。
方法: シフト ウィンドウ トランスフォーマーとマルチスケール情報融合 (MSIF) モジュールを使用した 3D デュアルブランチ エンコーダー セグメンテーション方法を提案します。
機能の統合を強化するために、MSIF モジュールは、シフト ウィンドウ フレームワークによるクロス アテンション メカニズムを使用して、マルチスケールの機能融合を実行します。
MSIF モジュール内のゲート ニューラル ネットワークは、各モダリティからの寄与のバランスを動的にとります。
モデルは、ダイス類似係数 (DSC) 損失関数を使用して最適化されました。
さらに、総代謝腫瘍体積 (TMTV) を計算し、統計分析を実行しました。
結果: モデルは 5 分割交差検証を使用して 165 人の DLBCL 患者のデータセットでトレーニングおよび検証され、DSC 0.7512 を達成しました。
統計分析では、比較手法と比較して大幅な改善が示されました (p < 0.05)。 さらに、手動アノテーションと TMTV 測定のセグメンテーション結果を比較すると、ピアソン相関係数 0.91 と R^2 0.89 が観察されました。 結論: この研究は、PET と CT イメージングの補完的な強みを活用した、DLBCL の効果的な自動セグメンテーション方法を提示します。 私たちの方法は、診断の解釈を改善し、DLBCL患者の治療計画を支援する可能性があります。

要約(オリジナル)

Background: Accurate segmentation of diffuse large B-cell lymphoma (DLBCL) lesions is challenging due to their complex patterns in medical imaging. Objective: This study aims to develop a precise segmentation method for DLBCL using 18F-Fluorodeoxyglucose (FDG) positron emission tomography (PET) and computed tomography (CT) images. Methods: We propose a 3D dual-branch encoder segmentation method using shifted window transformers and a Multi-Scale Information Fusion (MSIF) module. To enhance feature integration, the MSIF module performs multi-scale feature fusion using cross-attention mechanisms with a shifted window framework. A gated neural network within the MSIF module dynamically balances the contributions from each modality. The model was optimized using the Dice Similarity Coefficient (DSC) loss function. Additionally, we computed the total metabolic tumor volume (TMTV) and performed statistical analyses. Results: The model was trained and validated on a dataset of 165 DLBCL patients using 5-fold cross-validation, achieving a DSC of 0.7512. Statistical analysis showed a significant improvement over comparative methods (p < 0.05). Additionally, a Pearson correlation coefficient of 0.91 and an R^2 of 0.89 were observed when comparing manual annotations to segmentation results for TMTV measurement. Conclusion: This study presents an effective automatic segmentation method for DLBCL that leverages the complementary strengths of PET and CT imaging. Our method has the potential to improve diagnostic interpretations and assist in treatment planning for DLBCL patients.

arxiv情報

著者 Huan Huang,Liheng Qiu,Shenmiao Yang,Longxi Li,Jiaofen Nan,Yanting Li,Chuang Han,Fubao Zhu,Chen Zhao,Weihua Zhou
発行日 2024-09-09 16:17:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク