Perception and Localization of Macular Degeneration Applying Convolutional Neural Network, ResNet and Grad-CAM

要約

罹患した患者にぼやけた視界を送るよく知られた網膜疾患は、黄斑変性症です。
この研究は、眼底の患部を局在化することによって健康な眼底と黄斑変性眼底を分類することに基づいています。
CNN アーキテクチャと、ResNet アーキテクチャ (ResNet50、ResNet50v2、ResNet101、ResNet101v2、ResNet152、ResNet152v2) をバックボーンとする CNN を使用して、2 つのタイプの眼底を分類します。
データは、(a) トレーニング セットが 90%、テスト セットが 10%、(b) トレーニング セットが 80%、テスト セットが 20%、(c) トレーニング セットが 50%、テスト セットが 50 の 3 つのカテゴリに分割されます。
%。
トレーニング後、評価指標から最適なモデルが選択されます。
モデルの中で、ResNet50 のバックボーンを備えた CNN が最も優れたパフォーマンスを発揮し、90% のトレーニング データと 10% のテスト データ分割で 98.7% のトレーニング精度を実現しました。
このモデルを使用して、眼底の患部の領域を取得するために Grad-CAM 視覚化を実行しました。

要約(オリジナル)

A well-known retinal disease that sends blurry visions to the affected patients is Macular Degeneration. This research is based on classifying the healthy and macular degeneration fundus by localizing the affected region of the fundus. A CNN architecture and CNN with ResNet architecture (ResNet50, ResNet50v2, ResNet101, ResNet101v2, ResNet152, ResNet152v2) as the backbone are used to classify the two types of fundus. The data are split into three categories including (a) Training set is 90% and Testing set is 10% (b) Training set is 80% and Testing set is 20%, (c) Training set is 50% and Testing set is 50%. After the training, the best model has been selected from the evaluation metrics. Among the models, CNN with a backbone of ResNet50 performs best which gives the training accuracy of 98.7% for 90% train and 10% test data split. With this model, we have performed the Grad-CAM visualization to get the region of the affected area of the fundus.

arxiv情報

著者 Tahmim Hossain,Sagor Chandro Bakchy
発行日 2024-05-02 17:27:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク