Spontaneous Speech-Based Suicide Risk Detection Using Whisper and Large Language Models


この論文では、青少年の自発的な発話に基づく自殺リスクの自動検出を研究し、実験のために 10 歳から 18 歳までの 1,000 人以上の青少年から 15 時間の自殺発話を含む中国語のデータセットを収集します。
自発的な音声に埋め込まれた多様な音響的および言語的特徴を活用するために、ささやき音声モデルとテキスト大規模言語モデル (LLM) の両方が自殺リスクの検出に使用されます。
全パラメータ微調整アプローチとパラメータ効率の良い微調整アプローチの両方を使用して、事前トレーニングされたモデルを自殺リスク検出に適応させ、複数の音声テキスト融合アプローチを評価して、Whisper と LLM の表現を組み合わせます。
提案されたシステムは、119 人の被験者を含むテストセットで 0.807 の検出精度と 0.846 の F1 スコアを達成しており、実際の自殺リスク検出用途に有望な可能性があることを示しています。


The early detection of suicide risk is important since it enables the intervention to prevent potential suicide attempts. This paper studies the automatic detection of suicide risk based on spontaneous speech from adolescents, and collects a Mandarin dataset with 15 hours of suicide speech from more than a thousand adolescents aged from ten to eighteen for our experiments. To leverage the diverse acoustic and linguistic features embedded in spontaneous speech, both the Whisper speech model and textual large language models (LLMs) are used for suicide risk detection. Both all-parameter finetuning and parameter-efficient finetuning approaches are used to adapt the pre-trained models for suicide risk detection, and multiple audio-text fusion approaches are evaluated to combine the representations of Whisper and the LLM. The proposed system achieves a detection accuracy of 0.807 and an F1-score of 0.846 on the test set with 119 subjects, indicating promising potential for real suicide risk detection applications.


著者 Ziyun Cui,Chang Lei,Wen Wu,Yinan Duan,Diyang Qu,Ji Wu,Runsen Chen,Chao Zhang
発行日 2024-07-09 15:54:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク