要約
タイトル:AIモデルを閉鎖的に:多施設CTの堅牢なフェデレーテッド学習戦略
要約:
– 遺伝子、性別、人種、環境因子の人口の差異が病気に影響していることはよく知られているが、医療のAI研究は多様なデータソースを持つ地域性の患者コホートに重点を置いてきた。
– 大規模なデータ共有の障壁やデータプライバシーに関する倫理的懸念により、このような制限が生じている。
– フェデレーテッド学習(FL)は、データの共有なしに病院間で学習を可能にするAI開発の1つの方法である。
– 本研究では、5大陸にまたがる21の参加病院で収集されたCOVID-19胸部CTデータセット(患者数>10,000、画像数>1百万)に対して、様々なフェデレーテッド学習戦略の結果を示す。
– 実験では、クラスおよびサイズのアンバランスを克服するために、合成データを利用したFL戦略も提案されている。
– FLの文脈でデータの異質性の源を説明し、偏りが生じる可能性があることも示している。
要約(オリジナル)
While it is well known that population differences from genetics, sex, race, and environmental factors contribute to disease, AI studies in medicine have largely focused on locoregional patient cohorts with less diverse data sources. Such limitation stems from barriers to large-scale data share and ethical concerns over data privacy. Federated learning (FL) is one potential pathway for AI development that enables learning across hospitals without data share. In this study, we show the results of various FL strategies on one of the largest and most diverse COVID-19 chest CT datasets: 21 participating hospitals across five continents that comprise >10,000 patients with >1 million images. We also propose an FL strategy that leverages synthetically generated data to overcome class and size imbalances. We also describe the sources of data heterogeneity in the context of FL, and show how even among the correctly labeled populations, disparities can arise due to these biases.
arxiv情報
著者 | Edward H. Lee,Brendan Kelly,Emre Altinmakas,Hakan Dogan,Maryam Mohammadzadeh,Errol Colak,Steve Fu,Olivia Choudhury,Ujjwal Ratan,Felipe Kitamura,Hernan Chaves,Jimmy Zheng,Mourad Said,Eduardo Reis,Jaekwang Lim,Patricia Yokoo,Courtney Mitchell,Golnaz Houshmand,Marzyeh Ghassemi,Ronan Killeen,Wendy Qiu,Joel Hayden,Farnaz Rafiee,Chad Klochko,Nicholas Bevins,Faeze Sazgara,S. Simon Wong,Michael Moseley,Safwan Halabi,Kristen W. Yeom |
発行日 | 2023-04-13 21:28:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI