Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures


この研究では、生成フロー ネットワーク (GFlowNets) の確率的フレームワークを利用して、眼底画像を使用した眼疾患の分類と分析のために潜在的な離散ドロップアウト マスクにわたる事後分布を学習します。
私たちは、さまざまな眼の状態を識別する際のバックボーンとして、ResNet18 および ViT モデルと統合された GFlowOut を利用する、堅牢で一般化可能な方法を開発します。
この研究では、これらの眼底画像を分析する際のモデルのパフォーマンスを向上させるために、独自のドロップアウト マスク セット (なし、ランダム、ボトムアップ、トップダウン) を採用しています。
勾配マップ計算手法である Grad-CAM を利用してモデルの説明可能性を評価し、モデルが予測にとって重要な画像領域に正確に焦点を当てていることを観察しました。
ニューラル ネットワークへの GFlowOut の統合は、眼疾患の自動診断に有望な進歩をもたらし、臨床ワークフローと患者の転帰の改善に影響を及ぼします。


Ocular diseases, including diabetic retinopathy and glaucoma, present a significant public health challenge due to their high prevalence and potential for causing vision impairment. Early and accurate diagnosis is crucial for effective treatment and management. In recent years, deep learning models have emerged as powerful tools for analysing medical images, such as retina imaging. However, challenges persist in model relibability and uncertainty estimation, which are critical for clinical decision-making. This study leverages the probabilistic framework of Generative Flow Networks (GFlowNets) to learn the posterior distribution over latent discrete dropout masks for the classification and analysis of ocular diseases using fundus images. We develop a robust and generalizable method that utilizes GFlowOut integrated with ResNet18 and ViT models as the backbone in identifying various ocular conditions. This study employs a unique set of dropout masks – none, random, bottomup, and topdown – to enhance model performance in analyzing these fundus images. Our results demonstrate that our learnable probablistic latents significantly improves accuracy, outperforming the traditional dropout approach. We utilize a gradient map calculation method, Grad-CAM, to assess model explainability, observing that the model accurately focuses on critical image regions for predictions. The integration of GFlowOut in neural networks presents a promising advancement in the automated diagnosis of ocular diseases, with implications for improving clinical workflows and patient outcomes.


著者 Anirudh Prabhakaran,YeKun Xiao,Ching-Yu Cheng,Dianbo Liu
発行日 2025-01-13 18:06:23+00:00
arxivサイト arxiv_id(pdf)

