Using LLMs to Aid Annotation and Collection of Clinically-Enriched Data in Bipolar Disorder and Schizophrenia

要約

メンタルヘルスにおける NLP は主にソーシャルメディアに焦点を当ててきました。
現実世界の専門家もまた、ケース負荷が高く、多くの場合、ドメイン固有の変数を抱えていますが、最新の LLM にはコンテキストがありません。
私たちは、双極性障害 (BD)、統合失調症 (SZ)、および健康対照者 (HC) と診断された個人を含む 644 人の参加者を募集して作成されたデータセットを使用します。
参加者は標準化されたメンタルヘルス機器から得られたタスクに取り組み、その結果得られたデータは専門家によって 5 つの臨床変数にわたって転記され、注釈が付けられました。
この論文では、メンタルヘルス研究を強化するためのシーケンスツーシーケンスタスクにおける現代言​​語モデルの適用を実証します。
具体的には、これらのモデルがどのようにしてメンタルヘルス機器の展開、データ収集、およびデータ注釈を高い精度とスケーラビリティで容易に行えるかを説明します。
私たちは、小規模モデルがドメイン固有の臨床変数の注釈付け、メンタルヘルス機器のデータ収集が可能であり、商用の大規模モデルよりも優れたパフォーマンスを発揮できることを示します。

要約(オリジナル)

NLP in mental health has been primarily social media focused. Real world practitioners also have high case loads and often domain specific variables, of which modern LLMs lack context. We take a dataset made by recruiting 644 participants, including individuals diagnosed with Bipolar Disorder (BD), Schizophrenia (SZ), and Healthy Controls (HC). Participants undertook tasks derived from a standardized mental health instrument, and the resulting data were transcribed and annotated by experts across five clinical variables. This paper demonstrates the application of contemporary language models in sequence-to-sequence tasks to enhance mental health research. Specifically, we illustrate how these models can facilitate the deployment of mental health instruments, data collection, and data annotation with high accuracy and scalability. We show that small models are capable of annotation for domain-specific clinical variables, data collection for mental-health instruments, and perform better then commercial large models.

arxiv情報

著者 Ankit Aich,Avery Quynh,Pamela Osseyi,Amy Pinkham,Philip Harvey,Brenda Curtis,Colin Depp,Natalie Parde
発行日 2024-06-18 15:00:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク