Innovative Speech-Based Deep Learning Approaches for Parkinson’s Disease Classification: A Systematic Review


パーキンソン病 (PD) は世界で 2 番目に蔓延している神経変性疾患であり、初期段階の言語障害を呈することがよくあります。
人工知能 (AI)、特にディープラーニング (DL) の最近の進歩により、音声データの分析を通じて PD 診断が大幅に強化されました。
それにもかかわらず、主にプライバシー上の懸念により、公的にアクセス可能な音声ベースの PD データセットの利用が限られているため、研究の進歩は制限されています。
この体系的レビューの目的は、2020 年から 2024 年 3 月までに発表された 33 件の科学的研究に基づいて、PD 分類のための音声ベースの DL アプローチの現在の状況を調査することです。利用可能なリソース、機能、潜在的な制限、およびバイアスに関連する問題について議論します。
さらに、このレビューでは、公的にアクセス可能な音声ベースのデータセットと PD 用のオープンソース資料の概要を提供します。
DL アプローチは、エンドツーエンド (E2E) 学習、転移学習 (TL)、および深層音響特徴抽出 (DAFE) アプローチに分類されます。
E2E アプローチの中では畳み込みニューラル ネットワーク (CNN) が普及していますが、トランスフォーマーの人気も高まっています。
E2E アプローチは、特に Transformer の場合、限られたデータや計算リソースなどの課題に直面しています。
TL は、より堅牢な PD 診断と言語間でのより優れた汎用性を提供することで、これらの問題に対処します。
DAFE は、他の DL アプローチとより伝統的な機械学習 (ML) 手法の両方に対する深い特徴の具体的な効果を調べることにより、結果の説明可能性と解釈可能性を向上させることを目的としています。
ただし、E2E および TL アプローチと比較するとパフォーマンスが劣ることがよくあります。


Parkinson’s disease (PD), the second most prevalent neurodegenerative disorder worldwide, frequently presents with early-stage speech impairments. Recent advancements in Artificial Intelligence (AI), particularly deep learning (DL), have significantly enhanced PD diagnosis through the analysis of speech data. Nevertheless, the progress of research is restricted by the limited availability of publicly accessible speech-based PD datasets, primarily due to privacy concerns. The goal of this systematic review is to explore the current landscape of speech-based DL approaches for PD classification, based on 33 scientific works published between 2020 and March 2024. We discuss their available resources, capabilities, potential limitations, and issues related to bias, explainability, and privacy. Furthermore, this review provides an overview of publicly accessible speech-based datasets and open-source material for PD. The DL approaches are categorized into end-to-end (E2E) learning, transfer learning (TL) and deep acoustic features extraction (DAFE) approaches. Among E2E approaches, Convolutional Neural Networks (CNNs) are prevalent, though Transformers are increasingly popular. E2E approaches face challenges such as limited data and computational resources, especially with Transformers. TL addresses these issues by providing more robust PD diagnosis and better generalizability across languages. DAFE aims to improve the explainability and interpretability of results by examining the specific effects of deep features on both other DL approaches and more traditional machine learning (ML) methods. However, it often underperforms compared to E2E and TL approaches.


著者 Lisanne van Gelderen,Cristian Tejedor-García
発行日 2024-08-29 14:06:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS パーマリンク