Evaluate underdiagnosis and overdiagnosis bias of deep learning model on primary open-angle glaucoma diagnosis in under-served patient populations

要約

米国では、原発性開放隅角緑内障 (POAG) が失明の主な原因であり、特にアフリカ系アメリカ人とヒスパニック系の個人の間で顕著です。
深層学習は、その性能が臨床医による診断に匹敵するか、それを上回るため、眼底画像を使用して POAG を検出するために広く使用されています。
ただし、臨床診断における人間の偏見は、広く使用されている深層学習モデルに反映および増幅される可能性があり、その結果、モデルのパフォーマンスに影響を与えます。
偏見は、(1) 過少診断を引き起こし、治療の遅延や不適切な治療のリスクを高め、(2) 個人のストレス、恐怖、幸福感、および不必要で費用のかかる治療を増加させる可能性のある過剰診断を引き起こす可能性があります。
この研究では、米国の 16 州の 22 のセンターからの高眼圧治療研究 (OHTS) に基づいて、POAG 検出にディープ ラーニングを適用した場合の過少診断と過剰診断を調べました。
私たちの結果は、広く使用されている深層学習モデルが、十分なサービスを受けていない集団を過小診断または過剰診断する可能性があることを示しています。
最も過小診断されているグループは女性の若い (< 60 歳) グループであり、最も過剰診断されているグループは黒人の年配 (>=60 歳) グループです。
従来の深層学習手法による偏った診断は、疾患の検出や治療を遅らせ、十分なサービスを受けていない集団に負担を与える可能性があるため、眼科クリニックで深層学習モデルを使用することについて倫理的な懸念が生じます。

要約(オリジナル)

In the United States, primary open-angle glaucoma (POAG) is the leading cause of blindness, especially among African American and Hispanic individuals. Deep learning has been widely used to detect POAG using fundus images as its performance is comparable to or even surpasses diagnosis by clinicians. However, human bias in clinical diagnosis may be reflected and amplified in the widely-used deep learning models, thus impacting their performance. Biases may cause (1) underdiagnosis, increasing the risks of delayed or inadequate treatment, and (2) overdiagnosis, which may increase individuals’ stress, fear, well-being, and unnecessary/costly treatment. In this study, we examined the underdiagnosis and overdiagnosis when applying deep learning in POAG detection based on the Ocular Hypertension Treatment Study (OHTS) from 22 centers across 16 states in the United States. Our results show that the widely-used deep learning model can underdiagnose or overdiagnose underserved populations. The most underdiagnosed group is female younger (< 60 yrs) group, and the most overdiagnosed group is Black older (>=60 yrs) group. Biased diagnosis through traditional deep learning methods may delay disease detection, treatment and create burdens among under-served populations, thereby, raising ethical concerns about using deep learning models in ophthalmology clinics.

arxiv情報

著者 Mingquan Lin,Yuyun Xiao,Bojian Hou,Tingyi Wanyan,Mohit Manoj Sharma,Zhangyang Wang,Fei Wang,Sarah Van Tassel,Yifan Peng
発行日 2023-01-26 18:53:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク