Enhance Eye Disease Detection using Learnable Probabilistic Discrete Latents in Machine Learning Architectures

要約

糖尿病性網膜症や緑内障などの眼疾患は、その罹患率の高さと視力障害を引き起こす可能性があるため、公衆衛生上の重大な課題となっています。
効果的な治療と管理には、早期かつ正確な診断が不可欠です。
近年、深層学習モデルは、網膜イメージングなどの医療画像を分析するための強力なツールとして登場しました。
しかし、臨床上の意思決定にとって重要なモデルの信頼性と不確実性の推定には課題が残っています。
この研究では、生成フロー ネットワーク (GFlowNets) の確率的フレームワークを利用して、眼底画像を使用した眼疾患の分類と分析のために潜在的な離散ドロップアウト マスクにわたる事後分布を学習します。
私たちは、さまざまな眼の状態を識別する際のバックボーンとして、ResNet18 および ViT モデルと統合された GFlowOut を利用する、堅牢で一般化可能な方法を開発します。
この研究では、これらの眼底画像を分析する際のモデルのパフォーマンスを向上させるために、独自のドロップアウト マスク セット (なし、ランダム、ボトムアップ、トップダウン) を採用しています。
私たちの結果は、学習可能な確率的潜在が精度を大幅に向上させ、従来のドロップアウトアプローチを上回るパフォーマンスを示していることを示しています。
勾配マップ計算手法である Grad-CAM を利用してモデルの説明可能性を評価し、モデルが予測にとって重要な画像領域に正確に焦点を当てていることを観察しました。
ニューラル ネットワークへの GFlowOut の統合は、眼疾患の自動診断に有望な進歩をもたらし、臨床ワークフローと患者の転帰の改善に影響を及ぼします。

要約(オリジナル)

Ocular diseases, including diabetic retinopathy and glaucoma, present a significant public health challenge due to their high prevalence and potential for causing vision impairment. Early and accurate diagnosis is crucial for effective treatment and management. In recent years, deep learning models have emerged as powerful tools for analysing medical images, such as retina imaging. However, challenges persist in model relibability and uncertainty estimation, which are critical for clinical decision-making. This study leverages the probabilistic framework of Generative Flow Networks (GFlowNets) to learn the posterior distribution over latent discrete dropout masks for the classification and analysis of ocular diseases using fundus images. We develop a robust and generalizable method that utilizes GFlowOut integrated with ResNet18 and ViT models as the backbone in identifying various ocular conditions. This study employs a unique set of dropout masks – none, random, bottomup, and topdown – to enhance model performance in analyzing these fundus images. Our results demonstrate that our learnable probablistic latents significantly improves accuracy, outperforming the traditional dropout approach. We utilize a gradient map calculation method, Grad-CAM, to assess model explainability, observing that the model accurately focuses on critical image regions for predictions. The integration of GFlowOut in neural networks presents a promising advancement in the automated diagnosis of ocular diseases, with implications for improving clinical workflows and patient outcomes.

arxiv情報

著者 Anirudh Prabhakaran,YeKun Xiao,Ching-Yu Cheng,Dianbo Liu
発行日 2025-01-13 18:06:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク