A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds

要約

目的: fMRI および機能的結合 (FC) などの派生測定は、脳年齢、一般的な流動性知能、精神疾患の状態、および前臨床神経変性疾患を予測するために使用されてきました。
ただし、年齢、性別、人種などの人口統計上の混乱がすべて fMRI データから除去されているかどうかは必ずしも明らかではありません。
さらに、多くの fMRI データセットは認可された研究者に限定されているため、これらの貴重なデータ ソースの普及が困難になっています。
方法: 変分オートエンコーダ (VAE) ベースのモデル DemoVAE を作成し、人口統計から fMRI 特徴を非相関化し、ユーザーが指定した人口統計に基づいて高品質の合成 fMRI データを生成します。
私たちは、フィラデルフィア神経発達コホート (PNC) と中間表現型のための双極性および統合失調症ネットワーク (BSNIP) という 2 つの大規模で広く使用されているデータセットを使用してモデルをトレーニングし、検証します。
結果: DemoVAE は fMRI データにおけるグループの違いを再現し、個人の変動を幅広く捉えていることがわかりました。
重要なことに、fMRI データと相関しているほとんどの臨床およびコンピューター化されたバッテリー分野は、DemoVAE 潜在とは相関していないこともわかりました。
例外は、統合失調症の治療薬と症状の重症度に関連するいくつかの分野です。
結論: 私たちのモデルは、従来の VAE モデルや GAN モデルよりも優れた FC の完全な分布を捕捉する fMRI データを生成します。
また、fMRI データを使用した予測のほとんどは、人口統計との相関および予測に依存していることもわかりました。
重要性: 当社の DemoVAE モデルは、被験者の人口統計に条件付けされた高品質の合成データの生成と、人口統計の交絡的な影響の除去を可能にします。
私たちは、FC ベースの予測タスクが人口統計の交絡によって大きく影響されることを確認しました。

要約(オリジナル)

Objective: fMRI and derived measures such as functional connectivity (FC) have been used to predict brain age, general fluid intelligence, psychiatric disease status, and preclinical neurodegenerative disease. However, it is not always clear that all demographic confounds, such as age, sex, and race, have been removed from fMRI data. Additionally, many fMRI datasets are restricted to authorized researchers, making dissemination of these valuable data sources challenging. Methods: We create a variational autoencoder (VAE)-based model, DemoVAE, to decorrelate fMRI features from demographics and generate high-quality synthetic fMRI data based on user-supplied demographics. We train and validate our model using two large, widely used datasets, the Philadelphia Neurodevelopmental Cohort (PNC) and Bipolar and Schizophrenia Network for Intermediate Phenotypes (BSNIP). Results: We find that DemoVAE recapitulates group differences in fMRI data while capturing the full breadth of individual variations. Significantly, we also find that most clinical and computerized battery fields that are correlated with fMRI data are not correlated with DemoVAE latents. An exception are several fields related to schizophrenia medication and symptom severity. Conclusion: Our model generates fMRI data that captures the full distribution of FC better than traditional VAE or GAN models. We also find that most prediction using fMRI data is dependent on correlation with, and prediction of, demographics. Significance: Our DemoVAE model allows for generation of high quality synthetic data conditioned on subject demographics as well as the removal of the confounding effects of demographics. We identify that FC-based prediction tasks are highly influenced by demographic confounds.

arxiv情報

著者 Anton Orlichenko,Gang Qu,Ziyu Zhou,Anqi Liu,Hong-Wen Deng,Zhengming Ding,Julia M. Stephen,Tony W. Wilson,Vince D. Calhoun,Yu-Ping Wang
発行日 2024-05-13 17:49:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.NC, q-bio.QM パーマリンク