要約
神経学的ケアへのアクセスが限られていると、パーキンソン病(PD)が過少診断され、早期介入が妨げられます。
既存の AI ベースの PD 検出方法は、主に運動課題または言語課題の単峰性分析に焦点を当てており、疾患の多面的な性質を見落としています。
これに対処するために、845 人の参加者 (PD 付き 272 人) からの 1,102 セッション (各セッションには、ウェブカメラ経由でキャプチャされた指のタッピング、顔の表情、音声タスクのビデオが含まれている) で構成される大規模なマルチタスク ビデオ データセットを導入します。
私たちは、このマルチモーダル データを活用して診断精度を向上させる、新しい不確実性校正フュージョン ネットワーク (UFNet) を提案します。
UFNet は、独立したタスク固有のネットワークを採用しており、不確実性の定量化のためにモンテカルロ ドロップアウトでトレーニングされた後、タスク固有の不確実性に基づいて動的に調整される注意の重みによる特徴の自動融合を行います。
患者中心の評価を確実にするために、参加者はランダムに 3 つのセットに分割されました。60% がトレーニングに、20% がモデルの選択に、20% が最終的なパフォーマンス評価に割り当てられました。
UFNet は、劣らない特異性を維持しながら、精度、ROC 曲線下面積 (AUROC)、感度の点でシングルタスク モデルを大幅に上回りました。
不確実な予測を差し控えることでパフォーマンスはさらに向上し、2.3 については予測できないという代償を払って、精度 88.0+-0.3%、AUROC 93.0+-0.2%、感度 79.3+-0.9%、特異度 92.6+-0.3% を達成しました。
+-0.3% データ (+- は 95% 信頼区間を示します)。
さらに分析を進めると、トレーニングされたモデルは性別や民族サブグループ間で検出可能な偏りが見られず、50歳から80歳までの個人に最も効果的であることが示唆されています。ウェブカメラとマイクのみを必要とする私たちのアプローチは、特に地域でのアクセス可能な在宅ベースのPDスクリーニングを容易にします。
限られた医療リソースの中で。
要約(オリジナル)
Limited accessibility to neurological care leads to underdiagnosed Parkinson’s Disease (PD), preventing early intervention. Existing AI-based PD detection methods primarily focus on unimodal analysis of motor or speech tasks, overlooking the multifaceted nature of the disease. To address this, we introduce a large-scale, multi-task video dataset consisting of 1102 sessions (each containing videos of finger tapping, facial expression, and speech tasks captured via webcam) from 845 participants (272 with PD). We propose a novel Uncertainty-calibrated Fusion Network (UFNet) that leverages this multimodal data to enhance diagnostic accuracy. UFNet employs independent task-specific networks, trained with Monte Carlo Dropout for uncertainty quantification, followed by self-attended fusion of features, with attention weights dynamically adjusted based on task-specific uncertainties. To ensure patient-centered evaluation, the participants were randomly split into three sets: 60% for training, 20% for model selection, and 20% for final performance evaluation. UFNet significantly outperformed single-task models in terms of accuracy, area under the ROC curve (AUROC), and sensitivity while maintaining non-inferior specificity. Withholding uncertain predictions further boosted the performance, achieving 88.0+-0.3%$ accuracy, 93.0+-0.2% AUROC, 79.3+-0.9% sensitivity, and 92.6+-0.3% specificity, at the expense of not being able to predict for 2.3+-0.3% data (+- denotes 95% confidence interval). Further analysis suggests that the trained model does not exhibit any detectable bias across sex and ethnic subgroups and is most effective for individuals aged between 50 and 80. Requiring only a webcam and microphone, our approach facilitates accessible home-based PD screening, especially in regions with limited healthcare resources.
arxiv情報
著者 | Md Saiful Islam,Tariq Adnan,Jan Freyberg,Sangwu Lee,Abdelrahman Abdelkader,Meghan Pawlik,Cathe Schwartz,Karen Jaffe,Ruth B. Schneider,E Ray Dorsey,Ehsan Hoque |
発行日 | 2024-10-23 15:08:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google