Skin Lesion Diagnosis Using Convolutional Neural Networks

要約

癌性皮膚病変は人間で最もよく検出される悪性腫瘍の 1 つであり、早期に検出されないと死に至る可能性があります。
したがって、生存の可能性を最適化するには、早い段階で正確な結果にアクセスできることが重要です。
残念ながら、正確な結果は通常、高度な訓練を受けた皮膚科医によって得られますが、特に低所得国や中所得国では、多くの人がこの医師にアクセスできない可能性があります。
人工知能 (AI) は、医療専門家と同等かそれ以上の診断を提供できることが証明されているため、この問題に対する潜在的な解決策であると考えられます。
このプロジェクトは、さまざまな分野から最先端の画像分類技術を集めて実装することで、この問題を解決することを目的としています。
これらの手法には、ミックスアップ、プリサイジング、テスト時の拡張などが含まれます。
実装には、DenseNet121、バッチ正規化を備えた VGG16、および ResNet50 の 3 つのアーキテクチャが使用されました。
モデルは 2 つの主な目的を持って設計されました。
まず、画像をメラノサイト母斑、黒色腫、良性角化症様病変、基底細胞癌、日光角化症および上皮内癌、血管病変、皮膚線維腫の 7 つのカテゴリに分類します。
2 番目に、画像を良性か悪性に分類します。
モデルは 8012 枚の画像のデータセットを使用してトレーニングされ、そのパフォーマンスは 2003 枚の画像を使用して評価されました。
このモデルは、手作りの特徴抽出を必要とせず、画像からラベルまで直接エンドツーエンドでトレーニングされることは注目に値します。

要約(オリジナル)

Cancerous skin lesions are one of the most common malignancies detected in humans, and if not detected at an early stage, they can lead to death. Therefore, it is crucial to have access to accurate results early on to optimize the chances of survival. Unfortunately, accurate results are typically obtained by highly trained dermatologists, who may not be accessible to many people, particularly in low-income and middle-income countries. Artificial Intelligence (AI) appears to be a potential solution to this problem, as it has proven to provide equal or even better diagnoses than healthcare professionals. This project aims to address the issue by collecting state-of-the-art techniques for image classification from various fields and implementing them. Some of these techniques include mixup, presizing, and test-time augmentation, among others. Three architectures were used for the implementation: DenseNet121, VGG16 with batch normalization, and ResNet50. The models were designed with two main purposes. First, to classify images into seven categories, including melanocytic nevus, melanoma, benign keratosis-like lesions, basal cell carcinoma, actinic keratoses and intraepithelial carcinoma, vascular lesions, and dermatofibroma. Second, to classify images into benign or malignant. The models were trained using a dataset of 8012 images, and their performance was evaluated using 2003 images. It’s worth noting that this model is trained end-to-end, directly from the image to the labels, without the need for handcrafted feature extraction.

arxiv情報

著者 Daniel Alonso Villanueva Nunez,Yongmin Li
発行日 2023-05-18 17:15:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク