Identifying depression-related topics in smartphone-collected free-response speech recordings using an automatic speech recognition system and a deep learning topic model

要約

言語使用はうつ病と相関があることが示されていますが、大規模な検証が必要です。
臨床研究のような従来の方法は高価です。
そのため、うつ病を予測するために自然言語処理がソーシャルメディアで採用されてきましたが、検証済みのラベルの欠如、偏ったユーザーサンプル、コンテキストの欠如などの限界が残っています。
私たちの調査では、Whisper ツールと BERTopic モデルを使用して、265 人の参加者からスマートフォンで収集した 3919 件の音声録音から 29 のトピックを特定しました。
PHQ-8の中央値が10以上の6つのトピック(期待なし、睡眠、精神療法、散髪、勉強、授業)がうつ病のリスクトピックとみなされます。
トピックの出現とうつ病との関連性を解明するために、特定されたトピック間での行動 (ウェアラブルからの) および言語の特徴を比較しました。
話題の変化とうつ病の重症度の時間の経過との相関関係も調査され、言語使用を長期的に監視することの重要性が示されました。
また、同様の小規模なデータセット (57 人の参加者からの 356 の音声録音) で BERTopic モデルをテストし、一貫した結果が得られました。
要約すると、私たちの調査結果は、特定の会話の話題がうつ病の重症度を示している可能性があることを示しています。
提示されたデータ駆動型ワークフローは、デジタルヘルス研究のために現実世界の設定から大規模な音声データを収集および分析するための実用的なアプローチを提供します。

要約(オリジナル)

Language use has been shown to correlate with depression, but large-scale validation is needed. Traditional methods like clinic studies are expensive. So, natural language processing has been employed on social media to predict depression, but limitations remain-lack of validated labels, biased user samples, and no context. Our study identified 29 topics in 3919 smartphone-collected speech recordings from 265 participants using the Whisper tool and BERTopic model. Six topics with a median PHQ-8 greater than or equal to 10 were regarded as risk topics for depression: No Expectations, Sleep, Mental Therapy, Haircut, Studying, and Coursework. To elucidate the topic emergence and associations with depression, we compared behavioral (from wearables) and linguistic characteristics across identified topics. The correlation between topic shifts and changes in depression severity over time was also investigated, indicating the importance of longitudinally monitoring language use. We also tested the BERTopic model on a similar smaller dataset (356 speech recordings from 57 participants), obtaining some consistent results. In summary, our findings demonstrate specific speech topics may indicate depression severity. The presented data-driven workflow provides a practical approach to collecting and analyzing large-scale speech data from real-world settings for digital health research.

arxiv情報

著者 Yuezhou Zhang,Amos A Folarin,Judith Dineley,Pauline Conde,Valeria de Angel,Shaoxiong Sun,Yatharth Ranjan,Zulqarnain Rashid,Callum Stewart,Petroula Laiou,Heet Sankesara,Linglong Qian,Faith Matcham,Katie M White,Carolin Oetzmann,Femke Lamers,Sara Siddi,Sara Simblett,Björn W. Schuller,Srinivasan Vairavan,Til Wykes,Josep Maria Haro,Brenda WJH Penninx,Vaibhav A Narayan,Matthew Hotopf,Richard JB Dobson,Nicholas Cummins,RADAR-CNS consortium
発行日 2023-09-05 11:59:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SD, eess.AS, q-bio.QM パーマリンク