要約
目的: 臨床的に重要な前立腺がん (csPCa、グレード グループ >= 2) 検出のためのディープ ラジオミクス モデルを開発および評価し、そのパフォーマンスを多施設コホートにおける前立腺画像レポートおよびデータ システム (PI-RADS) 評価と比較する。
材料と方法:この後ろ向き研究では、2010 年から 2020 年の間に取得された 4 つのデータセット(PROSTATEx チャレンジ、Prostate158 チャレンジ、PCaMAP 試験、および
社内 (NTNU/St. Olavs Hospital) データセット。
専門家の注釈をグラウンド トゥルースとして使用して、前立腺の nnU-Net セグメンテーション、ボクセル単位のラジオミクス特徴抽出、極端な勾配ブースト分類、csPCa 検出マップへの腫瘍確率マップの後処理を含むディープ ラジオミクス モデルがトレーニングされました。
トレーニングには、PROSTATEx (n=199)、Prostate158 (n=138)、および PCaMAP (n=78) データセットを使用した 5 重交差検証と、社内 (n=200) データセットでのテストが含まれていました。
患者および病変レベルのパフォーマンスは、ROC 曲線下面積 (AUROC [95% CI])、感度、および特異性分析を使用して PI-RADS と比較されました。
結果: 検査データに関して、放射線科医は、PI-RADS >= 3 で感度 94% (75/80) および特異度 77% (92/120) で、患者レベルの AUROC 0.94 [0.91-0.98] を達成しました。
腫瘍確率カットオフ >= 0.76 のラジオミクス モデルは、90% (72/80) の感度と 73% (87/120) の特異性を備えた 0.91 [0.86-0.95] AUROC を達成し、PI-と有意差はありません (p = 0.068)。
ラッズ。
病変レベルでは、PI-RADS カットオフ >= 3 では、患者あたり 0.2 (40/200) の偽陽性で 84% (91/108) の感度が得られましたが、ディープ ラジオミクスは同じ条件で 68% (73/108) の感度を達成しました。
偽陽性率。
結論: ディープラジオミクス機械学習モデルは、患者レベルでの csPCa 検出において PI-RADS 評価と同等のパフォーマンスを達成しましたが、病変レベルでは達成できませんでした。
要約(オリジナル)
Objective: To develop and evaluate a deep radiomics model for clinically significant prostate cancer (csPCa, grade group >= 2) detection and compare its performance to Prostate Imaging Reporting and Data System (PI-RADS) assessment in a multicenter cohort. Materials and Methods: This retrospective study analyzed biparametric (T2W and DW) prostate MRI sequences of 615 patients (mean age, 63.1 +/- 7 years) from four datasets acquired between 2010 and 2020: PROSTATEx challenge, Prostate158 challenge, PCaMAP trial, and an in-house (NTNU/St. Olavs Hospital) dataset. With expert annotations as ground truth, a deep radiomics model was trained, including nnU-Net segmentation of the prostate gland, voxel-wise radiomic feature extraction, extreme gradient boost classification, and post-processing of tumor probability maps into csPCa detection maps. Training involved 5-fold cross-validation using the PROSTATEx (n=199), Prostate158 (n=138), and PCaMAP (n=78) datasets, and testing on the in-house (n=200) dataset. Patient- and lesion-level performance were compared to PI-RADS using area under ROC curve (AUROC [95% CI]), sensitivity, and specificity analysis. Results: On the test data, the radiologist achieved a patient-level AUROC of 0.94 [0.91-0.98] with 94% (75/80) sensitivity and 77% (92/120) specificity at PI-RADS >= 3. The deep radiomics model at a tumor probability cut-off >= 0.76 achieved 0.91 [0.86-0.95] AUROC with 90% (72/80) sensitivity and 73% (87/120) specificity, not significantly different (p = 0.068) from PI-RADS. On the lesion level, PI-RADS cut-off >= 3 had 84% (91/108) sensitivity at 0.2 (40/200) false positives per patient, while deep radiomics attained 68% (73/108) sensitivity at the same false positive rate. Conclusion: Deep radiomics machine learning model achieved comparable performance to PI-RADS assessment in csPCa detection at the patient-level but not at the lesion-level.
arxiv情報
著者 | G. A. Nketiah,M. R. Sunoqrot,E. Sandsmark,S. Langørgen,K. M. Selnæs,H. Bertilsson,M. Elschot,T. F. Bathen |
発行日 | 2024-10-21 17:41:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google