Perception and Localization of Macular Degeneration Applying Convolutional Neural Network, ResNet and Grad-CAM


CNN アーキテクチャと、ResNet アーキテクチャ (ResNet50、ResNet50v2、ResNet101、ResNet101v2、ResNet152、ResNet152v2) をバックボーンとする CNN を使用して、2 つのタイプの眼底を分類します。
データは、(a) トレーニング セットが 90%、テスト セットが 10%、(b) トレーニング セットが 80%、テスト セットが 20%、(c) トレーニング セットが 50%、テスト セットが 50 の 3 つのカテゴリに分割されます。
モデルの中で、ResNet50 のバックボーンを備えた CNN が最も優れたパフォーマンスを発揮し、90% のトレーニング データと 10% のテスト データ分割で 98.7% のトレーニング精度を実現しました。
このモデルを使用して、眼底の患部の領域を取得するために Grad-CAM 視覚化を実行しました。


A well-known retinal disease that sends blurry visions to the affected patients is Macular Degeneration. This research is based on classifying the healthy and macular degeneration fundus by localizing the affected region of the fundus. A CNN architecture and CNN with ResNet architecture (ResNet50, ResNet50v2, ResNet101, ResNet101v2, ResNet152, ResNet152v2) as the backbone are used to classify the two types of fundus. The data are split into three categories including (a) Training set is 90% and Testing set is 10% (b) Training set is 80% and Testing set is 20%, (c) Training set is 50% and Testing set is 50%. After the training, the best model has been selected from the evaluation metrics. Among the models, CNN with a backbone of ResNet50 performs best which gives the training accuracy of 98.7% for 90% train and 10% test data split. With this model, we have performed the Grad-CAM visualization to get the region of the affected area of the fundus.


著者 Tahmim Hossain,Sagor Chandro Bakchy
発行日 2024-05-02 17:27:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, eess.IV パーマリンク