要約
$ \ textbf {background} $:がんは、世界中の罹患率と死亡率の主要な原因の1つであり続けています。
さまざまな腫瘍部位にわたって組織病理学的画像と遺伝的および生存データを組み合わせた包括的なデータセットは、計算病理と個別化医療を進めるために不可欠です。
$ \ textbf {results} $:843の結腸直腸癌症例からの1,020 H&E染色全体のスライド画像(WSI)を含むデータセットであるSurgenを提示します。
データセットには、重要な遺伝的変異(KRA、NRA、BRAF)およびミスマッチ修復ステータスの詳細な注釈、および426症例の生存データが含まれています。
Surgenの実用的なユーティリティを実証するために、WSIからのミスマッチ修復ステータスを予測する概念実証機械学習実験を実施し、0.8316のテストAUROCを達成しました。
これらの予備的な結果は、結腸直腸癌におけるバイオマーカーの発見、予後モデリング、および高度な機械学習アプリケーションの研究を促進するデータセットの可能性を強調しています。
$ \ TextBF {結論} $:Surgenは、科学コミュニティに貴重なリソースを提供し、結腸直腸癌に関する包括的な臨床および遺伝情報とリンクした高品質のWSIを必要とする研究を可能にします。
最初の調査結果は、診断精度を進め、結腸直腸腫瘍学における個別化治療戦略の開発を促進するデータセットの能力を確認しています。
https://doi.org/10.6019/s-biad1285でオンラインで入手できるデータ。
要約(オリジナル)
$\textbf{Background}$: Cancer remains one of the leading causes of morbidity and mortality worldwide. Comprehensive datasets that combine histopathological images with genetic and survival data across various tumour sites are essential for advancing computational pathology and personalised medicine. $\textbf{Results}$: We present SurGen, a dataset comprising 1,020 H&E-stained whole slide images (WSIs) from 843 colorectal cancer cases. The dataset includes detailed annotations for key genetic mutations (KRAS, NRAS, BRAF) and mismatch repair status, as well as survival data for 426 cases. To demonstrate SurGen’s practical utility, we conducted a proof-of-concept machine learning experiment predicting mismatch repair status from the WSIs, achieving a test AUROC of 0.8316. These preliminary results underscore the dataset’s potential to facilitate research in biomarker discovery, prognostic modelling, and advanced machine learning applications in colorectal cancer. $\textbf{Conclusions}$: SurGen offers a valuable resource for the scientific community, enabling studies that require high-quality WSIs linked with comprehensive clinical and genetic information on colorectal cancer. Our initial findings affirm the dataset’s capacity to advance diagnostic precision and foster the development of personalised treatment strategies in colorectal oncology. Data available online at https://doi.org/10.6019/S-BIAD1285.
arxiv情報
著者 | Craig Myles,In Hwa Um,Craig Marshall,David Harris-Birtill,David J. Harrison |
発行日 | 2025-02-07 14:12:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google