Harvard Glaucoma Detection and Progression: A Multimodal Multitask Dataset and Generalization-Reinforced Semi-Supervised Learning

要約

緑内障は、世界的に不可逆的な失明の最大の原因です。
正確な緑内障の検出と進行予測における大きな課題は、光干渉断層撮影法 (OCT) の最先端 (SOTA) 3D 網膜イメージング データを使用してラベル付けされた患者が限られているというボトルネックです。
データ不足の問題に対処するために、このペーパーでは 2 つの解決策を提案します。
まず、ラベルなしデータを最適に利用するために、擬似スーパーバイザーと呼ばれる新しい汎化強化半教師あり学習 (SSL) モデルを開発します。
SOTA モデルと比較して、提案された擬似スーパーバイザーは、ラベルのないサンプルを使用して擬似ラベルを予測するポリシーを最適化し、経験的一般化を向上させます。
私たちの疑似スーパーバイザー モデルは、緑内障の検出と進行予測からなる 2 つの臨床タスクで評価されます。
進行予測タスクは単峰性と多峰性の両方で評価されます。
当社の擬似スーパーバイザ モデルは、SOTA SSL 比較モデルよりも優れたパフォーマンスを示します。
さらに、私たちのモデルは、公開されている LAG 眼底データセットでも最高の結果を達成しています。
次に、Harvard Glaucoma Detection and Progression (Harvard-GDP) Dataset を紹介します。これは、1,000 人の患者からの OCT 画像データと緑内障の検出と進行のラベルを含むマルチモーダル マルチタスク データセットです。
これは、3D OCT イメージング データを含む最大の緑内障検出データセットであり、公的に利用可能な最初の緑内障進行予測データセットです。
詳細な性別と人種の分析が提供されており、興味のある研究者は公平性学習の研究に使用できます。
私たちがリリースしたデータセットは、いくつかの SOTA 監視 CNN およびトランスフォーマー深層学習モデルでベンチマークされています。
データセットとコードは、\url{https://ophai.hms.harvard.edu/datasets/harvard-gdp1000} 経由で公開されています。

要約(オリジナル)

Glaucoma is the number one cause of irreversible blindness globally. A major challenge for accurate glaucoma detection and progression forecasting is the bottleneck of limited labeled patients with the state-of-the-art (SOTA) 3D retinal imaging data of optical coherence tomography (OCT). To address the data scarcity issue, this paper proposes two solutions. First, we develop a novel generalization-reinforced semi-supervised learning (SSL) model called pseudo supervisor to optimally utilize unlabeled data. Compared with SOTA models, the proposed pseudo supervisor optimizes the policy of predicting pseudo labels with unlabeled samples to improve empirical generalization. Our pseudo supervisor model is evaluated with two clinical tasks consisting of glaucoma detection and progression forecasting. The progression forecasting task is evaluated both unimodally and multimodally. Our pseudo supervisor model demonstrates superior performance than SOTA SSL comparison models. Moreover, our model also achieves the best results on the publicly available LAG fundus dataset. Second, we introduce the Harvard Glaucoma Detection and Progression (Harvard-GDP) Dataset, a multimodal multitask dataset that includes data from 1,000 patients with OCT imaging data, as well as labels for glaucoma detection and progression. This is the largest glaucoma detection dataset with 3D OCT imaging data and the first glaucoma progression forecasting dataset that is publicly available. Detailed sex and racial analysis are provided, which can be used by interested researchers for fairness learning studies. Our released dataset is benchmarked with several SOTA supervised CNN and transformer deep learning models. The dataset and code are made publicly available via \url{https://ophai.hms.harvard.edu/datasets/harvard-gdp1000}.

arxiv情報

著者 Yan Luo,Min Shi,Yu Tian,Tobias Elze,Mengyu Wang
発行日 2023-08-25 14:38:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク