Detecting Severity of Diabetic Retinopathy from Fundus Images using Ensembled Transformers

要約

糖尿病網膜症(Diabetic Retinopathy: DR)は、世界中の糖尿病患者の視力低下に影響するため、主要な懸念事項の一つと考えられています。糖尿病網膜症の重症度は、眼科医が眼底写真に基づく網膜画像から手動で把握することがほとんどである。本論文では、DRの重症度ステージを自動で理解することを扱います。これまでの文献では、従来の機械学習ベースのアルゴリズムや畳み込みアーキテクチャを用いた自動化に焦点を当てた研究が行われてきた。しかし、過去の研究では、モデル性能を向上させるために、網膜画像の本質的な部分にほとんど焦点を当てていない。本論文では、DRの重症度をより良く理解するために、網膜画像の重要な特徴を捉えるための変換器ベースの学習モデルを採用する。我々は、眼底写真からDRの重症度を推定するために、ViT(Vision Transformer)、BEiT(Bidirectional Encoder representation for image Transformer)、CaiT (Class-Attention in Image Transformers) 、およびDeiT (Data efficient image Transformers) という4つのモデル、画像変換器のアンサンブルに取り組む。実験には、一般に公開されているAPTOS-2019失明検出データセットを用い、変換器ベースのモデルの性能は非常に有望であった。

要約(オリジナル)

Diabetic Retinopathy (DR) is considered one of the primary concerns due to its effect on vision loss among most people with diabetes globally. The severity of DR is mostly comprehended manually by ophthalmologists from fundus photography-based retina images. This paper deals with an automated understanding of the severity stages of DR. In the literature, researchers have focused on this automation using traditional machine learning-based algorithms and convolutional architectures. However, the past works hardly focused on essential parts of the retinal image to improve the model performance. In this paper, we adopt transformer-based learning models to capture the crucial features of retinal images to understand DR severity better. We work with ensembling image transformers, where we adopt four models, namely ViT (Vision Transformer), BEiT (Bidirectional Encoder representation for image Transformer), CaiT (Class-Attention in Image Transformers), and DeiT (Data efficient image Transformers), to infer the degree of DR severity from fundus photographs. For experiments, we used the publicly available APTOS-2019 blindness detection dataset, where the performances of the transformer-based models were quite encouraging.

arxiv情報

著者 Chandranath Adak,Tejas Karkera,Soumi Chattopadhyay,Muhammad Saqib
発行日 2023-01-03 07:05:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク