Thousand Voices of Trauma: A Large-Scale Synthetic Dataset for Modeling Prolonged Exposure Therapy Conversations

要約

メンタルヘルスサポートのためのAIシステムの進歩は、特に外傷治療のための治療的会話データへのアクセスが制限されていることによって妨げられています。
私たちは、心的外傷後ストレス障害(PTSD)の長期曝露療法プロトコルに基づいて、3,000の療法会話の合成ベンチマークデータセットであるトラウマの千の声を提示します。
データセットは500のユニークなケースで構成されており、それぞれが最初の不安から苦痛へのピークへの治療の進行を反映する6つの会話視点を通して調査されています。
多様な人口統計プロファイル(18〜80歳、M = 49.3、49.4%、女性44.4%、6.2%の非バイナリ)、20種類の外傷タイプ、および10個の外傷関連の行動を、決定論的およびプロベリスティックな生成方法を使用して10個組み込みます。
分析では、外傷タイプ(暴力を目撃し、10.6%、いじめの10.2%)と症状(悪夢23.4%、薬物乱用20.8%)の現実的な分布が明らかになりました。
臨床専門家は、データセットの治療的忠実度を検証し、感情的な深さを強調しながら、より大きな信頼性のための改良を提案しました。
また、モデル応答を評価するための標準化されたメトリックを備えた感情的な軌跡ベンチマークを開発しました。
このプライバシーを提供するデータセットは、外傷中心のメンタルヘルスデータの重要なギャップに対処し、患者向け​​アプリケーションと臨床医のトレーニングツールの両方を進めるための貴重なリソースを提供します。

要約(オリジナル)

The advancement of AI systems for mental health support is hindered by limited access to therapeutic conversation data, particularly for trauma treatment. We present Thousand Voices of Trauma, a synthetic benchmark dataset of 3,000 therapy conversations based on Prolonged Exposure therapy protocols for Post-traumatic Stress Disorder (PTSD). The dataset comprises 500 unique cases, each explored through six conversational perspectives that mirror the progression of therapy from initial anxiety to peak distress to emotional processing. We incorporated diverse demographic profiles (ages 18-80, M=49.3, 49.4% male, 44.4% female, 6.2% non-binary), 20 trauma types, and 10 trauma-related behaviors using deterministic and probabilistic generation methods. Analysis reveals realistic distributions of trauma types (witnessing violence 10.6%, bullying 10.2%) and symptoms (nightmares 23.4%, substance abuse 20.8%). Clinical experts validated the dataset’s therapeutic fidelity, highlighting its emotional depth while suggesting refinements for greater authenticity. We also developed an emotional trajectory benchmark with standardized metrics for evaluating model responses. This privacy-preserving dataset addresses critical gaps in trauma-focused mental health data, offering a valuable resource for advancing both patient-facing applications and clinician training tools.

arxiv情報

著者 Suhas BN,Andrew M. Sherrill,Rosa I. Arriaga,Chris W. Wiese,Saeed Abdullah
発行日 2025-05-16 14:12:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T50, cs.AI, cs.CL, cs.CY, cs.HC, cs.LG, H.5.2 パーマリンク