要約
人体の最大の器官である皮膚は、さまざまな皮膚疾患を含む、総称して皮膚病変として知られるさまざまな症状に対して脆弱です。
これらの病変を診断することは、肉眼では感知できないことが多い微妙な視覚的な違いのため、医師にとって大きな課題となります。
すべての皮膚病変が生命を脅かすわけではありませんが、特定の種類の皮膚病変は皮膚がんなどの重篤な疾患の早期指標として機能する可能性があり、タイムリーで正確な診断方法の重要な必要性が強調されています。
深層学習アルゴリズムは、皮膚病変の早期発見と予後を容易にする顕著な可能性を実証しています。
この研究は、5 つの公的に利用可能なデータセットから合成された、39 のカテゴリーの皮膚病変で構成される包括的で多様なデータセットを厳選することにより、この分野を前進させています。
このデータセットを使用して、MobileNetV2、Xception、InceptionV3、EfficientNetB1、Vision Transformer の 5 つの最先端の深層学習モデルのパフォーマンスが厳密に評価されます。
これらのモデルの精度と堅牢性を強化するために、効率的チャネル アテンション (ECA) や畳み込みブロック アテンション モジュール (CBAM) などのアテンション メカニズムがそのアーキテクチャに組み込まれています。
複数のパフォーマンス指標にわたる包括的な評価により、CBAM と統合された Vision Transformer モデルが他のモデルよりも優れており、精度 93.46%、精度 94%、再現率 93%、F1 スコア 93%、特異度 93.67% を達成していることが明らかになりました。
これらの結果は、広範囲の皮膚病変を診断するための正確かつ効率的な予後ツールで医療専門家をサポートする上で、提案されたシステムの大きな可能性を強調しています。
この研究で使用されたデータセットとコードは、https://github.com/akabircs/Skin-Lesions-Classification にあります。
要約(オリジナル)
The skin, as the largest organ of the human body, is vulnerable to a diverse array of conditions collectively known as skin lesions, which encompass various dermatoses. Diagnosing these lesions presents significant challenges for medical practitioners due to the subtle visual differences that are often imperceptible to the naked eye. While not all skin lesions are life-threatening, certain types can act as early indicators of severe diseases, including skin cancers, underscoring the critical need for timely and accurate diagnostic methods. Deep learning algorithms have demonstrated remarkable potential in facilitating the early detection and prognosis of skin lesions. This study advances the field by curating a comprehensive and diverse dataset comprising 39 categories of skin lesions, synthesized from five publicly available datasets. Using this dataset, the performance of five state-of-the-art deep learning models — MobileNetV2, Xception, InceptionV3, EfficientNetB1, and Vision Transformer – is rigorously evaluated. To enhance the accuracy and robustness of these models, attention mechanisms such as the Efficient Channel Attention (ECA) and the Convolutional Block Attention Module (CBAM) are incorporated into their architectures. Comprehensive evaluation across multiple performance metrics reveals that the Vision Transformer model integrated with CBAM outperforms others, achieving an accuracy of 93.46%, precision of 94%, recall of 93%, F1-score of 93%, and specificity of 93.67%. These results underscore the significant potential of the proposed system in supporting medical professionals with accurate and efficient prognostic tools for diagnosing a broad spectrum of skin lesions. The dataset and code used in this study can be found at https://github.com/akabircs/Skin-Lesions-Classification.
arxiv情報
著者 | Sauda Adiv Hanum,Ashim Dey,Muhammad Ashad Kabir |
発行日 | 2025-01-10 14:25:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google