Detecting the Severity of Major Depressive Disorder from Speech: A Novel HARD-Training Methodology

要約

大うつ病性障害 (MDD) は、高い社会経済的コストを伴う世界的に一般的なメンタルヘルス問題です。
したがって、MDD の予測と自動検出は社会に大きな影響を与える可能性があります。
音声は、非侵襲的で信号を収集しやすいため、MDD の診断と評価を支援する有望なマーカーです。
これに関して、音声サンプルは、大うつ病性障害の病気と再発の遠隔評価 (RADAR-MDD) 研究プログラムの一環として収集されました。
RADAR-MDD は、スペイン、英国、オランダで MDD の病歴を持つ個人のコホートから音声およびその他のデジタル バイオマーカーを収集した観察コホート研究です。
この論文では、RADAR-MDD 音声コーパスを実験フレームワークとして採用し、2 クラスのうつ病重症度分類パラダイムにおけるローカル アテンション メカニズムを備えた Sequence-to-Sequence モデルの有効性をテストしました。
さらに、新しいトレーニング方法である HARD-Training が提案されています。
これは、モデル トレーニングのためのより曖昧なサンプルの選択に基づいた方法論であり、カリキュラム学習パラダイムに触発されています。
HARD トレーニングにより、使用された 2 つの音声誘発タスクと RADAR-MDD 音声コーパスの各収集サイトの両方について、分類器のパフォーマンスが平均 8.6% 向上することがわかりました。
この新しい方法論により、Sequence-to-Sequence モデルは言語に関係なく MDD の重大度を効果的に検出できました。
最後に、潜在的なアルゴリズムのバイアスをより深く認識する必要があることを認識し、男女別に結果の追加分析を実施します。

要約(オリジナル)

Major Depressive Disorder (MDD) is a common worldwide mental health issue with high associated socioeconomic costs. The prediction and automatic detection of MDD can, therefore, make a huge impact on society. Speech, as a non-invasive, easy to collect signal, is a promising marker to aid the diagnosis and assessment of MDD. In this regard, speech samples were collected as part of the Remote Assessment of Disease and Relapse in Major Depressive Disorder (RADAR-MDD) research programme. RADAR-MDD was an observational cohort study in which speech and other digital biomarkers were collected from a cohort of individuals with a history of MDD in Spain, United Kingdom and the Netherlands. In this paper, the RADAR-MDD speech corpus was taken as an experimental framework to test the efficacy of a Sequence-to-Sequence model with a local attention mechanism in a two-class depression severity classification paradigm. Additionally, a novel training method, HARD-Training, is proposed. It is a methodology based on the selection of more ambiguous samples for the model training, and inspired by the curriculum learning paradigm. HARD-Training was found to consistently improve – with an average increment of 8.6% – the performance of our classifiers for both of two speech elicitation tasks used and each collection site of the RADAR-MDD speech corpus. With this novel methodology, our Sequence-to-Sequence model was able to effectively detect MDD severity regardless of language. Finally, recognising the need for greater awareness of potential algorithmic bias, we conduct an additional analysis of our results separately for each gender.

arxiv情報

著者 Edward L. Campbell,Judith Dineley,Pauline Conde,Faith Matcham,Femke Lamers,Sara Siddi,Laura Docio-Fernandez,Carmen Garcia-Mateo,Nicholas Cummins,the RADAR-CNS Consortium
発行日 2023-05-25 17:24:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS, q-bio.QM パーマリンク