Improved Breast Cancer Diagnosis through Transfer Learning on Hematoxylin and Eosin Stained Histology Images


乳がんは、世界中の女性の主な死因の 1 つです。
この研究では、組織学的 (H\&E) 染色画像の最新の BRACS データセットを使用して乳がん腫瘍を分類しました。これには、全スライド画像 (WSI) と関心領域 (ROI) 画像の両方が含まれています。
私たちの研究では、ROI 画像を検討しました。
私たちは、ImageNet の重みで事前にトレーニングされた、Xception、EfficientNet、ResNet50、InceptionResNet など、さまざまな事前トレーニング済みの深層学習モデルを使用して実験を行ってきました。
BRACS ROI を画像拡張、アップサンプリング、データセット分割戦略とともに前処理しました。
デフォルトのデータセット分割では、ResNet50 が 66% の f1 スコアを達成することで最良の結果が得られました。
カスタム データセットの分割では、アップサンプリングと画像拡張を実行することで最良の結果が得られ、96.2% の f1 スコアが得られました。
2 番目のアプローチでは、偽陽性と偽陰性の分類の数もクラスごとに 3% 未満に減少しました。
全体として、この研究は主に 7 つの乳がん腫瘍サブタイプの特定に焦点を当てており、実験モデルをさらに微調整して、以前の乳がん組織学データセットに対しても一般化できると考えています。


Breast cancer is one of the leading causes of death for women worldwide. Early screening is essential for early identification, but the chance of survival declines as the cancer progresses into advanced stages. For this study, the most recent BRACS dataset of histological (H\&E) stained images was used to classify breast cancer tumours, which contains both the whole-slide images (WSI) and region-of-interest (ROI) images, however, for our study we have considered ROI images. We have experimented using different pre-trained deep learning models, such as Xception, EfficientNet, ResNet50, and InceptionResNet, pre-trained on the ImageNet weights. We pre-processed the BRACS ROI along with image augmentation, upsampling, and dataset split strategies. For the default dataset split, the best results were obtained by ResNet50 achieving 66% f1-score. For the custom dataset split, the best results were obtained by performing upsampling and image augmentation which results in 96.2% f1-score. Our second approach also reduced the number of false positive and false negative classifications to less than 3% for each class. We believe that our study significantly impacts the early diagnosis and identification of breast cancer tumors and their subtypes, especially atypical and malignant tumors, thus improving patient outcomes and reducing patient mortality rates. Overall, this study has primarily focused on identifying seven (7) breast cancer tumor subtypes, and we believe that the experimental models can be fine-tuned further to generalize over previous breast cancer histology datasets as well.


著者 Fahad Ahmed,Reem Abdel-Salam,Leon Hamnett,Mary Adewunmi,Temitope Ayano
発行日 2023-11-24 11:18:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, I.2.1, q-bio.CB パーマリンク