Comparative Analysis of Machine Learning Models for Lung Cancer Mutation Detection and Staging Using 3D CT Scans

要約

肺がんは世界中の癌死亡率の主な原因であり、重要な突然変異と病期分類を検出するための非侵襲的方法は、患者の転帰を改善するために不可欠です。
ここでは、ドメイン固有の前提を備えた監視されたモデルであるFMCIB+XGBoostの2つの機械学習モデルのパフォーマンスと、スタンフォード放射性発生症および肺CT-PT-DX COHORTSからの3D肺結節データの注意ベースの複数インスタンス学習を備えた自己監視モデルであるDinoV2+Abmilを比較します。
KRASおよびEGFR変異検出のタスクでは、FMCIB+XGBOOSTは一貫してDINOV2+ABMILを上回り、KRASおよびEGFR変異でそれぞれ0.846および0.883の精度を達成しました。
がんの病期分類では、DinoV2+Abmilは競争的一般化を実証し、肺CT-PT-DXコホートのTステージ予測で0.797の精度を達成し、多様なデータセット全体でSSLの適応性を示唆しています。
我々の結果は、突然変異検出における監視されたモデルの臨床的有用性を強調し、SSLの段階的一般化を改善する可能性を強調し、突然変異感度の向上領域を特定します。

要約(オリジナル)

Lung cancer is the leading cause of cancer mortality worldwide, and non-invasive methods for detecting key mutations and staging are essential for improving patient outcomes. Here, we compare the performance of two machine learning models – FMCIB+XGBoost, a supervised model with domain-specific pretraining, and Dinov2+ABMIL, a self-supervised model with attention-based multiple-instance learning – on 3D lung nodule data from the Stanford Radiogenomics and Lung-CT-PT-Dx cohorts. In the task of KRAS and EGFR mutation detection, FMCIB+XGBoost consistently outperformed Dinov2+ABMIL, achieving accuracies of 0.846 and 0.883 for KRAS and EGFR mutations, respectively. In cancer staging, Dinov2+ABMIL demonstrated competitive generalization, achieving an accuracy of 0.797 for T-stage prediction in the Lung-CT-PT-Dx cohort, suggesting SSL’s adaptability across diverse datasets. Our results emphasize the clinical utility of supervised models in mutation detection and highlight the potential of SSL to improve staging generalization, while identifying areas for enhancement in mutation sensitivity.

arxiv情報

著者 Yiheng Li,Francisco Carrillo-Perez,Mohammed Alawad,Olivier Gevaert
発行日 2025-05-28 17:04:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク