Benchmarking Deep Learning Frameworks for Automated Diagnosis of Ocular Toxoplasmosis: A Comprehensive Approach to Classification and Segmentation


眼トキソプラズマ症 (OT) は、T. gondii によって引き起こされる一般的な眼の感染症で、視覚障害を引き起こす可能性があります。
この問題に対処するために、転移学習技術を使用して眼底画像から OT を検出する既存の事前トレーニング済みネットワークの有効性を評価するベンチマーク研究を作成しました。
さらに、画像内の病変をセグメント化するための転移学習ベースのセグメンテーション ネットワークのパフォーマンスも分析しました。
この研究は、DL 技術を活用し、安価で自動化された使いやすく正確な診断方法を開発しようとしている将来の研究者にガイドを提供することを目的としています。
私たちは、OT 分類と病変のセグメンテーションに最適な手法を見つけるために、さまざまな特徴抽出手法を詳細に分析しました。
分類タスクでは、VGG16、MobileNetV2、InceptionV3、ResNet50、DenseNet121 モデルなどの事前トレーニング済みモデルを評価しました。
その中でも、MobileNetV2 は、精度 (Acc)、リコール、F1 スコアの点で他のすべてのモデルを上回っており、2 番目に優れたモデルである InceptionV3 を Acc で 0.7% 上回りました。
ただし、DenseNet121 は精度の点で最高の結果を達成し、MobileNetv2 より 0.1% 高くなりました。
セグメンテーション タスクに関して、この作業では U-Net アーキテクチャが活用されています。
転移学習を利用するために、従来の U-Net のエンコーダ ブロックが MobileNetV2、InceptionV3、ResNet34、および VGG16 に置き換えられ、さまざまなアーキテクチャが評価され、さらに 2 つの異なる損失関数 (Dice 損失と Jaccard 損失) が利用されました。
トレーニング中に Jaccard 損失関数が使用された場合、MobileNetV2/U-Net は、Acc スコアと Dice スコアに関して、それぞれ ResNet34 を 0.5% および 2.1% 上回りました。


Ocular Toxoplasmosis (OT), is a common eye infection caused by T. gondii that can cause vision problems. Diagnosis is typically done through a clinical examination and imaging, but these methods can be complicated and costly, requiring trained personnel. To address this issue, we have created a benchmark study that evaluates the effectiveness of existing pre-trained networks using transfer learning techniques to detect OT from fundus images. Furthermore, we have also analysed the performance of transfer-learning based segmentation networks to segment lesions in the images. This research seeks to provide a guide for future researchers looking to utilise DL techniques and develop a cheap, automated, easy-to-use, and accurate diagnostic method. We have performed in-depth analysis of different feature extraction techniques in order to find the most optimal one for OT classification and segmentation of lesions. For classification tasks, we have evaluated pre-trained models such as VGG16, MobileNetV2, InceptionV3, ResNet50, and DenseNet121 models. Among them, MobileNetV2 outperformed all other models in terms of Accuracy (Acc), Recall, and F1 Score outperforming the second-best model, InceptionV3 by 0.7% higher Acc. However, DenseNet121 achieved the best result in terms of Precision, which was 0.1% higher than MobileNetv2. For the segmentation task, this work has exploited U-Net architecture. In order to utilize transfer learning the encoder block of the traditional U-Net was replaced by MobileNetV2, InceptionV3, ResNet34, and VGG16 to evaluate different architectures moreover two different two different loss functions (Dice loss and Jaccard loss) were exploited in order to find the most optimal one. The MobileNetV2/U-Net outperformed ResNet34 by 0.5% and 2.1% in terms of Acc and Dice Score, respectively when Jaccard loss function is employed during the training.


著者 Syed Samiul Alam,Samiul Based Shuvo,Shams Nafisa Ali,Fardeen Ahmed,Arbil Chakma,Yeong Min Jang
発行日 2023-05-18 13:42:15+00:00
