要約
AI を使用してうつ病の兆候を検出する場合、AI モデルは習慣的に先制的な結論を導き出します。
私たちは、Patient Health Questionnaire-8 (PHQ-8) スコアを評価するために思考連鎖 (CoT) プロンプトを使用すると、AI モデルによって決定されるスコアの精度が向上すると理論付けしています。
私たちの調査結果では、モデルが CoT を使用して推論した場合、推定 PHQ-8 スコアは、CoT を使用しない場合と比較して、各参加者によって報告された許容された真のスコアに平均して一貫して近づきました。
私たちの目標は、AI モデルによる人間の会話の複雑さの理解を拡張し、患者の感情や口調をより効果的に評価できるようになり、それによって精神障害の症状をより正確に識別できるようにすることです。
最終的には、AI モデルの能力を強化して、医療分野で広くアクセスして使用できるようにしたいと考えています。
要約(オリジナル)
When using AI to detect signs of depressive disorder, AI models habitually draw preemptive conclusions. We theorize that using chain-of-thought (CoT) prompting to evaluate Patient Health Questionnaire-8 (PHQ-8) scores will improve the accuracy of the scores determined by AI models. In our findings, when the models reasoned with CoT, the estimated PHQ-8 scores were consistently closer on average to the accepted true scores reported by each participant compared to when not using CoT. Our goal is to expand upon AI models’ understanding of the intricacies of human conversation, allowing them to more effectively assess a patient’s feelings and tone, therefore being able to more accurately discern mental disorder symptoms; ultimately, we hope to augment AI models’ abilities, so that they can be widely accessible and used in the medical field.
arxiv情報
著者 | Elysia Shi,Adithri Manda,London Chowdhury,Runeema Arun,Kevin Zhu,Michael Lam |
発行日 | 2024-08-27 08:05:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google