要約
自殺と自殺行為は、依然として公共政策と医療にとって重大な課題です。
これに応えて、精神的危機に陥った個人に即時援助を提供するための心理サポート ホットラインが世界中で設立されています。
これらのホットラインの有効性は、発信者の感情状態、特に自殺リスクの増加を示す根底にある否定的な感情を正確に特定することに大きく依存します。
しかし、心理的介入に対する需要が高いため、専門のオペレーターが不足することが多く、効果的な音声感情認識モデルの必要性が浮き彫りになっています。
このモデルは、発信者の感情を自動的に検出して分析し、ホットライン サービスへの統合を容易にします。
さらに、心理的サポートのホットラインでのやりとりの大規模なデータ分析が可能になり、集団全体の心理的現象や行動を調査できるようになります。
私たちの研究は、中国最大の自殺ホットラインである北京心理サポートホットラインのデータを利用しています。
私たちは、発信者 105 人からの 20,630 セグメントを含む音声データを分析し、11 種類のネガティブな感情に分類しました。
私たちは、大規模な事前訓練済みモデルを使用して、否定的な感情認識モデルと詳細なマルチラベル分類モデルを開発しました。
私たちの実験では、否定的な感情認識モデルが最大 F1 スコア 76.96% を達成することが示されています。
ただし、きめ細かいマルチラベル分類タスクでは有効性が限られており、最良のモデルでも 41.74% の加重 F1 スコアしか達成できません。
私たちはこのタスクのエラー分析を実施し、将来の改善の可能性について議論し、研究の臨床応用の可能性を検討しました。
すべてのコードは公開されています。
要約(オリジナル)
Suicide and suicidal behaviors remain significant challenges for public policy and healthcare. In response, psychological support hotlines have been established worldwide to provide immediate help to individuals in mental crises. The effectiveness of these hotlines largely depends on accurately identifying callers’ emotional states, particularly underlying negative emotions indicative of increased suicide risk. However, the high demand for psychological interventions often results in a shortage of professional operators, highlighting the need for an effective speech emotion recognition model. This model would automatically detect and analyze callers’ emotions, facilitating integration into hotline services. Additionally, it would enable large-scale data analysis of psychological support hotline interactions to explore psychological phenomena and behaviors across populations. Our study utilizes data from the Beijing psychological support hotline, the largest suicide hotline in China. We analyzed speech data from 105 callers containing 20,630 segments and categorized them into 11 types of negative emotions. We developed a negative emotion recognition model and a fine-grained multi-label classification model using a large-scale pre-trained model. Our experiments indicate that the negative emotion recognition model achieves a maximum F1-score of 76.96%. However, it shows limited efficacy in the fine-grained multi-label classification task, with the best model achieving only a 41.74% weighted F1-score. We conducted an error analysis for this task, discussed potential future improvements, and considered the clinical application possibilities of our study. All the codes are public available.
arxiv情報
著者 | Zhonglong Chen,Changwei Song,Yining Chen,Jianqiang Li,Guanghui Fu,Yongsheng Tong,Qing Zhao |
発行日 | 2024-05-07 08:53:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google