Transfer-Ensemble Learning based Deep Convolutional Neural Networks for Diabetic Retinopathy Classification

要約

この記事の目的は、2 つの一般的な事前学習済み畳み込みニューラル ネットワーク、VGG16 と Inception V3 に基づくアンサンブル アプローチを使用して、糖尿病性網膜症 (DR) 疾患を 5 つの異なるクラスに分類することです。
提案されたモデルは、2 つの個別のネットの長所を活用して、糖尿病性網膜症の分類パフォーマンスを向上させることを目的としています。
アンサンブル モデル アーキテクチャには、学習済みの表現を効果的に利用するために、各事前トレーニング モデル内のレイヤーの一部をフリーズすることが含まれます。
出力特徴マップを固定長ベクトルに変換するために、グローバル平均プーリング レイヤーが追加されます。
次に、これらのベクトルが連結されて、入力画像の統合表現が形成されます。
アンサンブル モデルは、トレーニング セットと検証セットに分割された糖尿病性網膜症画像 (APTOS) のデータセットを使用してトレーニングされます。
トレーニング プロセス中に、モデルは網膜画像を対応する糖尿病性網膜症のクラスに分類する方法を学習します。
テスト セットの実験結果は、DR 分類に対する提案されたアンサンブル モデルの有効性が実証され、96.4% の精度を達成しました。

要約(オリジナル)

This article aims to classify diabetic retinopathy (DR) disease into five different classes using an ensemble approach based on two popular pre-trained convolutional neural networks: VGG16 and Inception V3. The proposed model aims to leverage the strengths of the two individual nets to enhance the classification performance for diabetic retinopathy. The ensemble model architecture involves freezing a portion of the layers in each pre-trained model to utilize their learned representations effectively. Global average pooling layers are added to transform the output feature maps into fixed-length vectors. These vectors are then concatenated to form a consolidated representation of the input image. The ensemble model is trained using a dataset of diabetic retinopathy images (APTOS), divided into training and validation sets. During the training process, the model learns to classify the retinal images into the corresponding diabetic retinopathy classes. Experimental results on the test set demonstrate the efficacy of the proposed ensemble model for DR classification achieving an accuracy of 96.4%.

arxiv情報

著者 Susmita Ghosh,Abhiroop Chatterjee
発行日 2023-08-01 13:07:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク