AI-Enhanced Cognitive Behavioral Therapy: Deep Learning and Large Language Models for Extracting Cognitive Pathways from Social Media Texts

要約

認知行動療法(CBT)は、精神疾患に起因する不合理な思考に対処する効果的な手法ですが、患者ケアにうまく導入するには認知経路を正確に特定する必要があります。
現在の社会では、個人がソーシャルメディア上で特定の話題に関して否定的な感情を頻繁に表現し、極端な場合には自殺行動を含む認知の歪みを示すことがよくあります。
しかし、心理療法士がオンラインで効果的な介入を行うのに役立つ認知経路を分析する方法論が著しく欠如している。
この研究では、ソーシャルメディアからデータを収集し、認知理論的枠組みに基づいてデータに注釈を付けて認知経路を抽出するタスクを確立しました。
私たちは当初、認知経路を抽出するタスクを、4 つの主要カテゴリと 19 のサブカテゴリからなる階層的なテキスト分類として分類しました。
これに続いて、心理療法士が重要な情報を迅速に把握できるように、テキスト要約タスクを構築しました。
私たちの実験では、これらのタスクにおける深層学習と大規模言語モデル (LLM) のパフォーマンスを評価します。
結果は、私たちの深層学習手法が階層テキスト分類タスクで 62.34% のマイクロ F1 スコアを達成したことを示しています。
一方、テキスト要約タスクでは、GPT-4 は Rouge-1 スコア 54.92、Rouge-2 スコア 30.86 を達成し、実験用深層学習モデルのパフォーマンスを上回りました。
ただし、幻覚の問題に悩まされる可能性があります。
この分野のさらなる研究をサポートするために、すべてのモデルとコードを公開しました。

要約(オリジナル)

Cognitive Behavioral Therapy (CBT) is an effective technique for addressing the irrational thoughts stemming from mental illnesses, but it necessitates precise identification of cognitive pathways to be successfully implemented in patient care. In current society, individuals frequently express negative emotions on social media on specific topics, often exhibiting cognitive distortions, including suicidal behaviors in extreme cases. Yet, there is a notable absence of methodologies for analyzing cognitive pathways that could aid psychotherapists in conducting effective interventions online. In this study, we gathered data from social media and established the task of extracting cognitive pathways, annotating the data based on a cognitive theoretical framework. We initially categorized the task of extracting cognitive pathways as a hierarchical text classification with four main categories and nineteen subcategories. Following this, we structured a text summarization task to help psychotherapists quickly grasp the essential information. Our experiments evaluate the performance of deep learning and large language models (LLMs) on these tasks. The results demonstrate that our deep learning method achieved a micro-F1 score of 62.34% in the hierarchical text classification task. Meanwhile, in the text summarization task, GPT-4 attained a Rouge-1 score of 54.92 and a Rouge-2 score of 30.86, surpassing the experimental deep learning model’s performance. However, it may suffer from an issue of hallucination. We have made all models and codes publicly available to support further research in this field.

arxiv情報

著者 Meng Jiang,Yi Jing Yu,Qing Zhao,Jianqiang Li,Changwei Song,Hongzhi Qi,Wei Zhai,Dan Luo,Xiaoqin Wang,Guanghui Fu,Bing Xiang Yang
発行日 2024-04-17 14:55:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク