要約
構造磁気共鳴画像法 (MRI) データを使用した予測モデリングは、脳の老化を研究するための優れたアプローチです。
機械学習アルゴリズムと特徴抽出方法は、予測を改善し、健康で加速した老化を調査するために採用されています。
神経変性疾患および精神疾患。
高次元の MRI データは、一般化可能で解釈可能なモデルの構築とデータ プライバシーの観点から課題を引き起こします。
一般的な手法は、事前定義されたパーセル内のボクセルをリサンプリングまたは平均化することですが、領域内のボクセルは老化と異なる関係にある可能性があるため、解剖学的特異性と生物学的解釈可能性が低下します。
実際、平均化による単純な融合は情報の損失と精度の低下を引き起こす可能性があります。
概念的に新しい 2 レベルのスタッキング アンサンブル (SE) アプローチを紹介します。
第 1 レベルは、ボクセルごとの情報に基づいて個人の年齢を予測するための地域モデルで構成され、最終的な予測を生成する第 2 レベルのモデルと融合されます。
成人の寿命をカバーする 4 つのデータセットからの灰白質体積 (GMV) 推定値を入力として使用して、8 つのデータ融合シナリオが調査されました。
平均絶対誤差 (MAE)、R2、相関および予測バイアスを使用して測定されたパフォーマンスは、SE が地域ごとの平均を上回っていることを示しました。
最高のパフォーマンスは、独立したサイト固有のデータでトレーニングされた第 2 レベルのモデルを使用して、第 1 レベルの地域予測がアプリケーション サイトのサンプル外予測として取得された場合に得られました (MAE=4.75 対ベースライン地域平均 GMV MAE=5.68)。
。
トレーニングに使用されるデータセットが増えるにつれてパフォーマンスが向上しました。
第 1 レベルの予測では、新しい生物学的洞察と強化されたデータ プライバシーを提供する、改善され、より堅牢な老化シグナルが示されました。
全体として、SE はデータ プライバシーを維持または強化しながら、ベースラインと比較して精度を向上させます。
要約(オリジナル)
Predictive modeling using structural magnetic resonance imaging (MRI) data is a prominent approach to study brain-aging. Machine learning algorithms and feature extraction methods have been employed to improve predictions and explore healthy and accelerated aging e.g. neurodegenerative and psychiatric disorders. The high-dimensional MRI data pose challenges to building generalizable and interpretable models as well as for data privacy. Common practices are resampling or averaging voxels within predefined parcels, which reduces anatomical specificity and biological interpretability as voxels within a region may differently relate to aging. Effectively, naive fusion by averaging can result in information loss and reduced accuracy. We present a conceptually novel two-level stacking ensemble (SE) approach. The first level comprises regional models for predicting individuals’ age based on voxel-wise information, fused by a second-level model yielding final predictions. Eight data fusion scenarios were explored using as input Gray matter volume (GMV) estimates from four datasets covering the adult lifespan. Performance, measured using mean absolute error (MAE), R2, correlation and prediction bias, showed that SE outperformed the region-wise averages. The best performance was obtained when first-level regional predictions were obtained as out-of-sample predictions on the application site with second-level models trained on independent and site-specific data (MAE=4.75 vs baseline regional mean GMV MAE=5.68). Performance improved as more datasets were used for training. First-level predictions showed improved and more robust aging signal providing new biological insights and enhanced data privacy. Overall, the SE improves accuracy compared to the baseline while preserving or enhancing data privacy.
arxiv情報
著者 | Georgios Antonopoulos,Shammi More,Simon B. Eickhoff,Federico Raimondo,Kaustubh R. Patil |
発行日 | 2025-01-17 12:24:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google