A Foundation Model Framework for Multi-View MRI Classification of Extramural Vascular Invasion and Mesorectal Fascia Invasion in Rectal Cancer

要約

背景:壁外血管浸潤(EVI)およびメソレクトル筋膜浸潤(MFI)の正確なMRIベースの同定は、直腸癌のリスク層化された管理にとって極めて重要ですが、視覚的評価は主観的で脆弱性に対して脆弱です。
目的:AxialおよびSagital T2強調MRIでEVIとMFIを自動的に分類するマルチセンターのファンデーションモデル駆動型フレームワークを開発および外部的に開発します。
方法:このレトロスペクティブ研究は、3つのヨーロッパ病院からの331の治療前の直腸がんMRI検査を使用しました。
TotalSegmentator誘導直腸パッチ抽出の後、スキャナー関連のコントラストシフトを最小限に抑えるために、自己監視された周波数ドメイン調和パイプラインが訓練されました。
4つの分類器を比較しました:ResNet50、SeresNet、普遍的な生物医学的前処理トランス(UMEDPT)が軽量MLPヘッド、フローズンUMEDPT機能(UMEDPT_LR)を使用したロジスティック回帰バリアント。
結果:UMEDPT_LRは、軸方向および矢状の特徴が融合したときに最適なEVI検出を達成しました(AUC = 0.82;感度= 0.75; F1スコア= 0.73)。
最高のMFIパフォーマンスは、軸方向に調和した画像のUMEDPTによって達成され(AUC = 0.77)、Chaimeleon Grand-Challengeの勝者(AUC = 0.75)を上回りました。
周波数ドメインの調和により、MFI分類が改善されましたが、EVIのパフォーマンスに影響を与えました。
特にF1スコアとバランスの取れた精度で、従来のCNN(ResNet50、SeresNet)がパフォーマンスが低い。
結論:これらの調査結果は、基礎モデルの特徴、調和、およびマルチビュー融合を組み合わせて、直腸MRIの診断パフォーマンスを大幅に向上させることを示しています。

要約(オリジナル)

Background: Accurate MRI-based identification of extramural vascular invasion (EVI) and mesorectal fascia invasion (MFI) is pivotal for risk-stratified management of rectal cancer, yet visual assessment is subjective and vulnerable to inter-institutional variability. Purpose: To develop and externally evaluate a multicenter, foundation-model-driven framework that automatically classifies EVI and MFI on axial and sagittal T2-weighted MRI. Methods: This retrospective study used 331 pre-treatment rectal cancer MRI examinations from three European hospitals. After TotalSegmentator-guided rectal patch extraction, a self-supervised frequency-domain harmonization pipeline was trained to minimize scanner-related contrast shifts. Four classifiers were compared: ResNet50, SeResNet, the universal biomedical pretrained transformer (UMedPT) with a lightweight MLP head, and a logistic-regression variant using frozen UMedPT features (UMedPT_LR). Results: UMedPT_LR achieved the best EVI detection when axial and sagittal features were fused (AUC = 0.82; sensitivity = 0.75; F1 score = 0.73), surpassing the Chaimeleon Grand-Challenge winner (AUC = 0.74). The highest MFI performance was attained by UMedPT on axial harmonized images (AUC = 0.77), surpassing the Chaimeleon Grand-Challenge winner (AUC = 0.75). Frequency-domain harmonization improved MFI classification but variably affected EVI performance. Conventional CNNs (ResNet50, SeResNet) underperformed, especially in F1 score and balanced accuracy. Conclusion: These findings demonstrate that combining foundation model features, harmonization, and multi-view fusion significantly enhances diagnostic performance in rectal MRI.

arxiv情報

著者 Yumeng Zhang,Zohaib Salahuddin,Danial Khan,Shruti Atul Mali,Henry C. Woodruff,Sina Amirrajab,Eduardo Ibor-Crespo,Ana Jimenez-Pastor,Luis Marti-Bonmati,Philippe Lambin
発行日 2025-05-23 16:04:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク