The Relationship Between Speech Features Changes When You Get Depressed: Feature Correlations for Improving Speed and Performance of Depression Detection

要約

この研究は、うつ病によって音声から抽出された特徴間の相関が変化することを示しています。
さらに、このような洞察を使用すると、SVM と LSTM に基づくうつ病検出器のトレーニング速度とパフォーマンスを向上できることが示されています。
実験は、専門の精神科医によってうつ病と診断された 58 人を含む 112 人の話者が参加する公開データセットである Androids Corpus に対して行われました。
結果は、実験で使用されたモデルが、特徴ベクトルではなく特徴相関行列を供給された場合に、トレーニング速度とパフォーマンスの点で向上することを示しています。
エラー率の相対的な減少は、モデルに応じて 23.1% ~ 26.6% の範囲になります。
おそらく説明としては、落ち込んだ話者の場合、特徴相関行列がより変動しやすいように見えるということです。
同様に、そのような現象はうつ病のマーカーと考えることができます。

要約(オリジナル)

This work shows that depression changes the correlation between features extracted from speech. Furthermore, it shows that using such an insight can improve the training speed and performance of depression detectors based on SVMs and LSTMs. The experiments were performed over the Androids Corpus, a publicly available dataset involving 112 speakers, including 58 people diagnosed with depression by professional psychiatrists. The results show that the models used in the experiments improve in terms of training speed and performance when fed with feature correlation matrices rather than with feature vectors. The relative reduction of the error rate ranges between 23.1% and 26.6% depending on the model. The probable explanation is that feature correlation matrices appear to be more variable in the case of depressed speakers. Correspondingly, such a phenomenon can be thought of as a depression marker.

arxiv情報

著者 Fuxiang Tao,Wei Ma,Xuri Ge,Anna Esposito,Alessandro Vinciarelli
発行日 2023-07-07 09:31:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク