A Study on the Performance of Generative Pre-trained Transformer (GPT) in Simulating Depressed Individuals on the Standardized Depressive Symptom Scale

要約

背景: うつ病は、社会的および経済的負担を伴う一般的な精神障害です。
現在の診断は自己申告と評価尺度に依存しており、信頼性の問題があります。
うつ病の診断には客観的なアプローチが必要です。
目的: うつ病の診断における GPT テクノロジーの可能性を評価します。
うつ病患者をシミュレートするその能力を評価し、うつ病スケールの影響を調査します。
方法: 3 つのうつ病関連評価ツール (HAMD-17、SDS、GDS-15) を使用しました。
2 つの実験では、正常な人とうつ病の人に対する GPT 反応をシミュレートしました。
GPT の応答と予想される結果を比較し、うつ病の症状に対する理解と、さまざまな条件下でのパフォーマンスの違いを評価します。
結果: うつ病の評価における GPT のパフォーマンスが評価されました。
これは、うつ病患者と正常な個人の両方のスコア基準と一致していました。
うつ病の重症度に基づいて、いくつかのパフォーマンスの違いが観察されました。
GPT は、感度が高いスケールでより優れたパフォーマンスを発揮しました。
結論: GPT は、うつ病関連の評価中にうつ病患者と正常な個人を正確にシミュレートします。
さまざまな程度のうつ病をシミュレーションすると逸脱が発生し、軽度および中等度のケースの理解が制限されます。
GPT は感度の高いスケールでより優れたパフォーマンスを示し、より効果的なうつ病スケールを開発できる可能性を示しています。
GPT はうつ病の評価において重要な可能性を秘めており、臨床医と患者をサポートします。

要約(オリジナル)

Background: Depression is a common mental disorder with societal and economic burden. Current diagnosis relies on self-reports and assessment scales, which have reliability issues. Objective approaches are needed for diagnosing depression. Objective: Evaluate the potential of GPT technology in diagnosing depression. Assess its ability to simulate individuals with depression and investigate the influence of depression scales. Methods: Three depression-related assessment tools (HAMD-17, SDS, GDS-15) were used. Two experiments simulated GPT responses to normal individuals and individuals with depression. Compare GPT’s responses with expected results, assess its understanding of depressive symptoms, and performance differences under different conditions. Results: GPT’s performance in depression assessment was evaluated. It aligned with scoring criteria for both individuals with depression and normal individuals. Some performance differences were observed based on depression severity. GPT performed better on scales with higher sensitivity. Conclusion: GPT accurately simulates individuals with depression and normal individuals during depression-related assessments. Deviations occur when simulating different degrees of depression, limiting understanding of mild and moderate cases. GPT performs better on scales with higher sensitivity, indicating potential for developing more effective depression scales. GPT has important potential in depression assessment, supporting clinicians and patients.

arxiv情報

著者 Sijin Cai,Nanfeng Zhang,Jiaying Zhu,Yanjie Liu,Yongjin Zhou
発行日 2023-07-17 15:44:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.NC パーマリンク