要約
肺がん治療における標的治療のための標準的な診断手順には、組織学的サブタイプ分類とそれに続くEGFRなどの主要なドライバー変異の検出が含まれる。分子プロファイリングによってドライバー変異を発見できるとしても、そのプロセスはしばしば高価で時間がかかる。ディープラーニング指向の画像解析は、スライド全体画像(WSI)から直接ドライバー変異を発見するための、より経済的な代替手段を提供します。本研究では、弱い監視を伴うカスタマイズされた深層学習パイプラインを使用して、腫瘍の検出と組織学的サブタイピングに加えて、ヘマトキシリンとエオシン染色されたWSIからEGFR変異の形態的相関を識別しました。TCGAとインドの民間データセットの2つの肺がんデータセットに対して厳密な実験とアブレーションスタディを行い、我々のパイプラインの有効性を実証しています。その結果、TCGAデータセットにおいて、腫瘍の検出では平均曲線下面積(AUC)0.964、腺癌と扁平上皮癌の組織学的サブタイピングでは0.942を達成しました。EGFR検出については、TCGAデータセットで平均0.864、インドからのデータセットで0.783のAUCを達成しました。我々の重要な学習ポイントは以下の通りです。第一に、組織学的に学習させた特徴抽出層を使用しても、ターゲットデータセットで特徴抽出器を微調整する場合には、特に利点はない。第二に、細胞数の多いパッチを選択することで、おそらく腫瘍領域を捉えることができるが、腫瘍に隣接する間質に疾患クラスの徴候が存在する可能性があるため、必ずしも有用ではない。
要約(オリジナル)
The standard diagnostic procedures for targeted therapies in lung cancer treatment involve histological subtyping and subsequent detection of key driver mutations, such as EGFR. Even though molecular profiling can uncover the driver mutation, the process is often expensive and time-consuming. Deep learning-oriented image analysis offers a more economical alternative for discovering driver mutations directly from whole slide images (WSIs). In this work, we used customized deep learning pipelines with weak supervision to identify the morphological correlates of EGFR mutation from hematoxylin and eosin-stained WSIs, in addition to detecting tumor and histologically subtyping it. We demonstrate the effectiveness of our pipeline by conducting rigorous experiments and ablation studies on two lung cancer datasets – TCGA and a private dataset from India. With our pipeline, we achieved an average area under the curve (AUC) of 0.964 for tumor detection, and 0.942 for histological subtyping between adenocarcinoma and squamous cell carcinoma on the TCGA dataset. For EGFR detection, we achieved an average AUC of 0.864 on the TCGA dataset and 0.783 on the dataset from India. Our key learning points include the following. Firstly, there is no particular advantage of using a feature extractor layers trained on histology, if one is going to fine-tune the feature extractor on the target dataset. Secondly, selecting patches with high cellularity, presumably capturing tumor regions, is not always helpful, as the sign of a disease class may be present in the tumor-adjacent stroma.
arxiv情報
| 著者 | Ravi Kant Gupta,Shivani Nandgaonkar,Nikhil Cherian Kurian,Swapnil Rane,Amit Sethi |
| 発行日 | 2022-09-08 12:02:47+00:00 |
| arxivサイト | arxiv_id(pdf) |