Integration of Radiomics and Tumor Biomarkers in Interpretable Machine Learning Models

要約

コンピューター ビジョンにおけるディープ ニューラル ネットワーク (DNN) の前例のないパフォーマンスにもかかわらず、医用画像を使用した癌の診断と予後における DNN の実用的なアプリケーションは限られています。
診断 DNN を放射線および腫瘍学アプリケーションに統合する際の重要な課題の 1 つは、解釈可能性の欠如であり、臨床医がモデル予測を理解するのを妨げています。
したがって、肺がんのコンピューター断層撮影 (CT) スキャンのために、ConRad と呼ばれる解釈可能な分類器に専門家由来のラジオミクスと DNN 予測バイオマーカーを統合することを研究し、提案します。
重要なことに、腫瘍バイオマーカーはコンセプトボトルネックモデル (CBM) から予測されるため、トレーニングが完了すると、ConRad モデルは労働集約的で時間のかかるバイオマーカーを必要としません。
私たちの評価と実際のアプリケーションでは、ConRad への唯一の入力はセグメント化された CT スキャンです。
提案されたモデルは、ブラック ボックス分類器として機能する畳み込みニューラル ネットワーク (CNN) と比較されます。
さらに、5 つの異なる分類子におけるラジオミクス、予測されるバイオマーカー、および CNN 機能のすべての組み合わせを調査および評価しました。
ConRad の解釈可能性がその主な利点であることを強調していますが、非線形 SVM を使用する ConRad モデルと Lasso を使用したロジスティック回帰が 5 倍の交差検証で他のモデルよりも優れていることがわかりました。
なげなわは特徴選択に使用され、精度を高めながらゼロ以外の重みの数を大幅に減らします。
全体として、提案された ConRad モデルは、CBM 由来のバイオマーカーとラジオミクス機能を解釈可能な ML モデルに組み合わせており、肺結節の悪性分類に優れた性能を発揮します。

要約(オリジナル)

Despite the unprecedented performance of deep neural networks (DNNs) in computer vision, their practical application in the diagnosis and prognosis of cancer using medical imaging has been limited. One of the critical challenges for integrating diagnostic DNNs into radiological and oncological applications is their lack of interpretability, preventing clinicians from understanding the model predictions. Therefore, we study and propose the integration of expert-derived radiomics and DNN-predicted biomarkers in interpretable classifiers which we call ConRad, for computerized tomography (CT) scans of lung cancer. Importantly, the tumor biomarkers are predicted from a concept bottleneck model (CBM) such that once trained, our ConRad models do not require labor-intensive and time-consuming biomarkers. In our evaluation and practical application, the only input to ConRad is a segmented CT scan. The proposed model is compared to convolutional neural networks (CNNs) which act as a black box classifier. We further investigated and evaluated all combinations of radiomics, predicted biomarkers and CNN features in five different classifiers. We found the ConRad models using non-linear SVM and the logistic regression with the Lasso outperform others in five-fold cross-validation, although we highlight that interpretability of ConRad is its primary advantage. The Lasso is used for feature selection, which substantially reduces the number of non-zero weights while increasing the accuracy. Overall, the proposed ConRad model combines CBM-derived biomarkers and radiomics features in an interpretable ML model which perform excellently for the lung nodule malignancy classification.

arxiv情報

著者 Lennart Brocki,Neo Christopher Chung
発行日 2023-03-20 15:00:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, stat.AP, stat.ML パーマリンク