Predicting recovery following stroke: deep learning, multimodal data and feature selection using explainable AI

要約

機械学習は、脳卒中後の症状とリハビリテーションに対する反応を自動予測する大きな可能性をもたらします。
この取り組みの主な課題には、神経画像データの次元が非常に高いこと、学習に利用できるデータセットのサイズが比較的小さいこと、神経画像データと表形式のデータ (人口統計情報や臨床的特徴など) を効果的に組み合わせる方法などが含まれます。
このペーパーでは、2 つの戦略に基づいていくつかのソリューションを評価します。
1 つ目は、MRI スキャンを要約した 2D 画像を使用することです。
2 つ目は、分類精度を向上させる主要な特徴を選択することです。
さらに、MRI から抽出された関心領域と表形式データのシンボリック表現を組み合わせた画像上で畳み込みニューラル ネットワーク (CNN) をトレーニングする新しいアプローチを紹介します。
MRI と表形式データのさまざまな表現でトレーニングされた一連の CNN アーキテクチャ (2D と 3D の両方) を評価し、脳卒中後の音声による絵の説明能力の複合尺度が失語症または非失語症の範囲にあるかを予測します。
MRI と表形式のデータは、PLORAS 研究に参加した英語を話す脳卒中生存者 758 人から取得されました。
ベースラインのロジスティック回帰の分類精度は、病変サイズのみで 0.678 でしたが、初期症状の重症度と回復時間を連続的に追加すると、0.757 と 0.813 に上昇しました。
各 MRI スキャンから 8 つの関心領域を抽出し、2D 残差ニューラル ネットワークで病変サイズ、初期重症度、回復時間を組み合わせた場合、最高の分類精度 0.854 が観察されました。私たちの調査結果は、画像データと表形式データをどのように組み合わせることができるかを示しています。
データセットが機械学習の観点から見て小さい場合でも、脳卒中後の分類精度が高くなります。
最後に、病院のスキャナーからの画像を使用して、さらに高いレベルの精度を達成するために現在のモデルをどのように改善できるかを提案します。

要約(オリジナル)

Machine learning offers great potential for automated prediction of post-stroke symptoms and their response to rehabilitation. Major challenges for this endeavour include the very high dimensionality of neuroimaging data, the relatively small size of the datasets available for learning, and how to effectively combine neuroimaging and tabular data (e.g. demographic information and clinical characteristics). This paper evaluates several solutions based on two strategies. The first is to use 2D images that summarise MRI scans. The second is to select key features that improve classification accuracy. Additionally, we introduce the novel approach of training a convolutional neural network (CNN) on images that combine regions-of-interest extracted from MRIs, with symbolic representations of tabular data. We evaluate a series of CNN architectures (both 2D and a 3D) that are trained on different representations of MRI and tabular data, to predict whether a composite measure of post-stroke spoken picture description ability is in the aphasic or non-aphasic range. MRI and tabular data were acquired from 758 English speaking stroke survivors who participated in the PLORAS study. The classification accuracy for a baseline logistic regression was 0.678 for lesion size alone, rising to 0.757 and 0.813 when initial symptom severity and recovery time were successively added. The highest classification accuracy 0.854 was observed when 8 regions-of-interest was extracted from each MRI scan and combined with lesion size, initial severity and recovery time in a 2D Residual Neural Network.Our findings demonstrate how imaging and tabular data can be combined for high post-stroke classification accuracy, even when the dataset is small in machine learning terms. We conclude by proposing how the current models could be improved to achieve even higher levels of accuracy using images from hospital scanners.

arxiv情報

著者 Adam White,Margarita Saranti,Artur d’Avila Garcez,Thomas M. H. Hope,Cathy J. Price,Howard Bowman
発行日 2023-10-29 22:31:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.LG パーマリンク