Reduced Deep Convolutional Activation Features (R-DeCAF) in Histopathology Images to Improve the Classification Performance for Breast Cancer Diagnosis

要約

乳がんは、世界中で女性の間で2番目に多いがんです。病理医が乳がんを診断するのは時間がかかり、主観的である。そこで、病理医の負担を軽減するために、データを自動的に分類するコンピュータ支援診断の枠組みが利用されており、深層畳み込みニューラルネットワーク(CNN)が有効な解決策となります。CNNの活性化層から抽出される特徴は、深層畳み込み活性化特徴(DeCAF)と呼ばれ、深層畳み込みニューラルネットワークの活性化層から抽出される特徴は、深層畳み込み活性化特徴(DeCAF)とも呼ばれる。本論文では、全てのDeCAF特徴が必ずしも分類タスクの高精度化につながらないことを分析し、次元削減が重要な役割を果たすことを示した。そこで、DeCAF特徴の本質を捉えた効果的な特徴の組み合わせを実現するために、様々な次元削減手法を適用する。この目的のために、我々は縮小型深層畳み込み活性化特徴量(R-DeCAF)を提案した。この枠組みでは、AlexNet、VGG-16、VGG-19などの事前に学習したCNNを特徴抽出器として転移学習で利用する。DeCAFの特徴は、これらのCNNの最初の完全接続層から抽出され、サポートベクターマシンが二値分類に用いられている。線形および非線形次元削減アルゴリズムのうち、主成分分析(PCA)のような線形アプローチは、深い特徴間のより良い組み合わせを表し、特徴の累積説明分散(CEV)の特定の量を考慮して、少ない数の特徴を用いた分類タスクにおいてより高い精度につながる。提案手法を実験用データセットBreakHisを用いて検証した。その結果,少ない計算時間で最大4.3%の分類精度の向上が見られた.また,学習済みのAlexNetを特徴抽出器として用い,PCAを特徴量削減アルゴリズムとして用いることで,特徴ベクトルの大きさが23,CEVが0.15の400xデータに対して91.13%の最高精度を達成した.

要約(オリジナル)

Breast cancer is the second most common cancer among women worldwide. Diagnosis of breast cancer by the pathologists is a time-consuming procedure and subjective. Computer aided diagnosis frameworks are utilized to relieve pathologist workload by classifying the data automatically, in which deep convolutional neural networks (CNNs) are effective solutions. The features extracted from activation layer of pre-trained CNNs are called deep convolutional activation features (DeCAF). In this paper, we have analyzed that all DeCAF features are not necessarily led to a higher accuracy in the classification task and dimension reduction plays an important role. Therefore, different dimension reduction methods are applied to achieve an effective combination of features by capturing the essence of DeCAF features. To this purpose, we have proposed reduced deep convolutional activation features (R-DeCAF). In this framework, pre-trained CNNs such as AlexNet, VGG-16 and VGG-19 are utilized in transfer learning mode as feature extractors. DeCAF features are extracted from the first fully connected layer of the mentioned CNNs and support vector machine has been used for binary classification. Among linear and nonlinear dimensionality reduction algorithms, linear approaches such as principal component analysis (PCA) represent a better combination among deep features and lead to a higher accuracy in the classification task using small number of features considering specific amount of cumulative explained variance (CEV) of features. The proposed method is validated using experimental BreakHis dataset. Comprehensive results show improvement in the classification accuracy up to 4.3% with less computational time. Best achieved accuracy is 91.13% for 400x data with feature vector size (FVS) of 23 and CEV equals to 0.15 using pre-trained AlexNet as feature extractor and PCA as feature reduction algorithm.

arxiv情報

著者 Bahareh Morovati,Reza Lashgari,Mojtaba Hajihasani,Hasti Shabani
発行日 2023-01-05 06:53:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク