Skin cancer diagnosis using NIR spectroscopy data of skin lesions in vivo using machine learning algorithms


ここ数年、病変のほとんどの画像データと臨床データを使用するコンピュータ支援診断 (CAD) への関心が高まっています。
NIR 分光法は、皮膚病変の自動 CAD に代わる情報源を提供する可能性があります。
分光分析で使用される最も一般的に使用される手法と分類アルゴリズムは、主成分分析 (PCA)、部分最小二乗法判別分析 (PLS-DA)、およびサポート ベクター マシン (SVM) です。
それにもかかわらず、機械学習と深層学習 (MDL) の最新の技術を分光学に適用することへの関心が高まっています。
MDL を分光法に適用する場合の主な制限の 1 つは、公開データセットが不足していることです。
私たちが知る限り、皮膚病変に対する NIR スペクトル データの公的データセットは存在しないため、分類のゴールドスタンダードを生成するための取り組みが行われ、NIR-SC-UFES という名前の新しいデータセットが収集、注釈付け、分析されました。
NIR スペクトル データの皮膚がんへの影響。
次に、機械学習アルゴリズム XGBoost、CatBoost、LightGBM、1D 畳み込みニューラル ネットワーク (1D-CNN) を調査して、がんと非がんの皮膚病変を分類しました。
実験結果は、標準正規変量 (SNV) を使用した前処理、特徴抽出により、バランスの取れた精度の値が 0.839、再現率が 0.851、精度が 0.852、F スコアが 0.850 という値を提供する LightGBM によって最高のパフォーマンスが得られることを示しています。


Skin lesions are classified in benign or malignant. Among the malignant, melanoma is a very aggressive cancer and the major cause of deaths. So, early diagnosis of skin cancer is very desired. In the last few years, there is a growing interest in computer aided diagnostic (CAD) using most image and clinical data of the lesion. These sources of information present limitations due to their inability to provide information of the molecular structure of the lesion. NIR spectroscopy may provide an alternative source of information to automated CAD of skin lesions. The most commonly used techniques and classification algorithms used in spectroscopy are Principal Component Analysis (PCA), Partial Least Squares – Discriminant Analysis (PLS-DA), and Support Vector Machines (SVM). Nonetheless, there is a growing interest in applying the modern techniques of machine and deep learning (MDL) to spectroscopy. One of the main limitations to apply MDL to spectroscopy is the lack of public datasets. Since there is no public dataset of NIR spectral data to skin lesions, as far as we know, an effort has been made and a new dataset named NIR-SC-UFES, has been collected, annotated and analyzed generating the gold-standard for classification of NIR spectral data to skin cancer. Next, the machine learning algorithms XGBoost, CatBoost, LightGBM, 1D-convolutional neural network (1D-CNN) were investigated to classify cancer and non-cancer skin lesions. Experimental results indicate the best performance obtained by LightGBM with pre-processing using standard normal variate (SNV), feature extraction providing values of 0.839 for balanced accuracy, 0.851 for recall, 0.852 for precision, and 0.850 for F-score. The obtained results indicate the first steps in CAD of skin lesions aiming the automated triage of patients with skin lesions in vivo using NIR spectral data.


著者 Flavio P. Loss,Pedro H. da Cunha,Matheus B. Rocha,Madson Poltronieri Zanoni,Leandro M. de Lima,Isadora Tavares Nascimento,Isabella Rezende,Tania R. P. Canuto,Luciana de Paula Vieira,Renan Rossoni,Maria C. S. Santos,Patricia Lyra Frasson,Wanderson Romão,Paulo R. Filgueiras,Renato A. Krohling
発行日 2024-01-02 13:03:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク