DRStageNet: Deep Learning for Diabetic Retinopathy Staging from Fundus Images

要約

糖尿病性網膜症 (DR) は、失明の重大なリスクを伴う糖尿病の一般的な合併症です。
視覚障害を抑制するには、タイムリーな識別が重要です。
デジタル眼底画像 (DFI) から DR ステージングを行うためのアルゴリズムが最近提案されています。
ただし、モデルがトレーニングされたソース ドメインとモデルがデプロイされるターゲット ドメインの間の分布の変化により、モデルは一般化できないことがよくあります。
一般的かつ特に困難な変化は、ソース ドメインとターゲット ドメインのサポートが完全に重複していない場合によく発生します。
この研究では、この課題を軽減するために設計された深層学習モデルである DRStageNet を紹介します。
私たちは、さまざまな患者の人口統計、民族、地理的起源、併存疾患をカバーする合計 93,534 の DFI で構成される 7 つの公的に利用可能なデータセットを使用しました。
自己教師ありビジョン トランスフォーマーの事前トレーニング済みモデルである DINOv2 を微調整し、汎化パフォーマンスを向上させるためにマルチソース ドメインの微調整戦略を実装します。
私たちはベンチマークを実施し、最近公開された基礎モデルを含む 2 つの最先端のベンチマークに対するこの手法の優位性を実証します。
高解像度の説明可能性ヒートマップを提供するために、grad-rollout メソッドを回帰タスクに適用しました。
エラー分析により、主なエラーの 59\% に間違った参照ラベルが含まれていることがわかりました。
DRStageNet は [原稿を受理すると] URL からアクセスできます。

要約(オリジナル)

Diabetic retinopathy (DR) is a prevalent complication of diabetes associated with a significant risk of vision loss. Timely identification is critical to curb vision impairment. Algorithms for DR staging from digital fundus images (DFIs) have been recently proposed. However, models often fail to generalize due to distribution shifts between the source domain on which the model was trained and the target domain where it is deployed. A common and particularly challenging shift is often encountered when the source- and target-domain supports do not fully overlap. In this research, we introduce DRStageNet, a deep learning model designed to mitigate this challenge. We used seven publicly available datasets, comprising a total of 93,534 DFIs that cover a variety of patient demographics, ethnicities, geographic origins and comorbidities. We fine-tune DINOv2, a pretrained model of self-supervised vision transformer, and implement a multi-source domain fine-tuning strategy to enhance generalization performance. We benchmark and demonstrate the superiority of our method to two state-of-the-art benchmarks, including a recently published foundation model. We adapted the grad-rollout method to our regression task in order to provide high-resolution explainability heatmaps. The error analysis showed that 59\% of the main errors had incorrect reference labels. DRStageNet is accessible at URL [upon acceptance of the manuscript].

arxiv情報

著者 Yevgeniy Men,Jonathan Fhima,Leo Anthony Celi,Lucas Zago Ribeiro,Luis Filipe Nakayama,Joachim A. Behar
発行日 2023-12-22 18:09:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク