Deep Learning Approach for Enhancing Oral Squamous Cell Carcinoma with LIME Explainable AI Technique

要約

本研究の目標は、口腔癌分析用の病理組織学的画像データベースを使用した縦断的コホート研究により、口腔扁平上皮癌 (OSCC) の診断性能を向上させるために深層学習モデルのアプリケーションを分析することです。
データセットは 5,192 枚の画像 (通常 2,435 枚と OSCC 2,511 枚) で構成されており、OSCC グループの推定比率再分割率は約 52% でトレーニング、テスト、検証セット間に割り当てられました。それでも、パフォーマンス測定は組み合わせで検証されました。
このユースケースでは、ほぼ同じ数のサンプルを含むセットです。これは、データベース全体が、やはりほぼ二値比率に基づく層化分割技術を使用して半分に分割されているためですが、全体の分布はほぼ均等でした。
本研究では、評価のために ResNet101、DenseNet121、VGG16、および EfficientnetB3 の 4 つのディープラーニング アーキテクチャを選択しました。
EfficientNetB3 が 98.33% の精度と F1 スコア (0.9844) で最高であることが判明し、他のモデルと比較して消費する計算能力が著しく少なくなりました。
続くのは DenseNet121 で、精度は 90.24%、F1 スコアは 90.45% でした。
さらに、Local Interpretable Model-agnostic Explains (LIME) 手法を採用して、EfficientNetB3 が予測を使用して特定の決定を下した理由を明らかにし、結果の説明可能性と信頼性を向上させました。
この研究は、LIME などの AI 技術の説明とともに、EfficientNetB3 モデルからアクティブ化された OSCC で優れた診断が可能であるという証拠を提供し、臨床使用に向けて構築するための重要な基礎を築きます。

要約(オリジナル)

The goal of the present study is to analyze an application of deep learning models in order to augment the diagnostic performance of oral squamous cell carcinoma (OSCC) with a longitudinal cohort study using the Histopathological Imaging Database for oral cancer analysis. The dataset consisted of 5192 images (2435 Normal and 2511 OSCC), which were allocated between training, testing, and validation sets with an estimated ratio repartition of about 52% for the OSCC group, and still, our performance measure was validated on a combination set that contains almost equal number of sample in this use case as entire database have been divided into half using stratified splitting technique based again near binary proportion but total distribution was around even. We selected four deep-learning architectures for evaluation in the present study: ResNet101, DenseNet121, VGG16, and EfficientnetB3. EfficientNetB3 was found to be the best, with an accuracy of 98.33% and F1 score (0.9844), and it took remarkably less computing power in comparison with other models. The subsequent one was DenseNet121, with 90.24% accuracy and an F1 score of 90.45%. Moreover, we employed the Local Interpretable Model-agnostic Explanations (LIME) method to clarify why EfficientNetB3 made certain decisions with its predictions to improve the explainability and trustworthiness of results. This work provides evidence for the possible superior diagnosis in OSCC activated from the EfficientNetB3 model with the explanation of AI techniques such as LIME and paves an important groundwork to build on towards clinical usage.

arxiv情報

著者 Samiha Islam,Muhammad Zawad Mahmud,Shahran Rahman Alve,Md. Mejbah Ullah Chowdhury
発行日 2024-11-21 14:53:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク