Process Knowledge-infused Learning for Clinician-friendly Explanations

要約

言語モデルには、ソーシャル メディア データを使用してメンタルヘルスを評価できる可能性があります。
これらのモデルは、オンラインの投稿や会話を分析することで、うつ病、不安、自殺念慮などの精神的健康状態を示すパターンを検出できます。
彼らは、キーワード、言語マーカー、感情を調べて、個人の精神的健康についての洞察を得ることができます。
この情報は、早期発見、介入、サポート、メンタルヘルスケアと予防戦略の改善に不可欠です。
ただし、ソーシャル メディアからのメンタルヘルス評価に言語モデルを使用することには 2 つの制限があります。(1) 臨床医の診断プロセスに対して投稿を比較しません。(2) 臨床医が理解できる概念を使用して言語モデルの出力を説明するのは困難です。
、臨床医に優しい説明。
この研究では、言語モデルの出力に臨床プロセスの知識構造を重ねる新しい学習パラダイムであるプロセス知識注入学習 (PK-iL) を紹介し、基礎となる言語モデルの予測を臨床医が理解しやすい説明を可能にします。
私たちは、このような臨床プロセスの知識を追加した既存のベンチマーク データセットでメソッドを厳密にテストし、自殺傾向を評価するための新しいデータセットをリリースします。
PK-iL は競争力を発揮し、ユーザーとの 70% の合意を達成していますが、他の XAI 手法は 47% の合意しか達成していません (評価者間の合意の平均は 0.72)。
私たちの評価は、PK-iL がモデルの予測を臨床医に効果的に説明していることを示しています。

要約(オリジナル)

Language models have the potential to assess mental health using social media data. By analyzing online posts and conversations, these models can detect patterns indicating mental health conditions like depression, anxiety, or suicidal thoughts. They examine keywords, language markers, and sentiment to gain insights into an individual’s mental well-being. This information is crucial for early detection, intervention, and support, improving mental health care and prevention strategies. However, using language models for mental health assessments from social media has two limitations: (1) They do not compare posts against clinicians’ diagnostic processes, and (2) It’s challenging to explain language model outputs using concepts that the clinician can understand, i.e., clinician-friendly explanations. In this study, we introduce Process Knowledge-infused Learning (PK-iL), a new learning paradigm that layers clinical process knowledge structures on language model outputs, enabling clinician-friendly explanations of the underlying language model predictions. We rigorously test our methods on existing benchmark datasets, augmented with such clinical process knowledge, and release a new dataset for assessing suicidality. PK-iL performs competitively, achieving a 70% agreement with users, while other XAI methods only achieve 47% agreement (average inter-rater agreement of 0.72). Our evaluations demonstrate that PK-iL effectively explains model predictions to clinicians.

arxiv情報

著者 Kaushik Roy,Yuxin Zi,Manas Gaur,Jinendra Malekar,Qi Zhang,Vignesh Narayanan,Amit Sheth
発行日 2023-06-16 13:08:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク