Identifying Mentions of Pain in Mental Health Records Text: A Natural Language Processing Approach

要約

タイトル:自然言語処理手法によるメンタルヘルス記録テキストの中の痛みの言及の特定

要約:

– 痛みは医療リソースを利用する主要な理由の1つであり、特にメンタルヘルスとの重複に関する研究分野の1つである。
– メンタルヘルスの電子健康記録は、この重複に関する研究に適したデータソースであるが、痛みに関する情報は自由文書に含まれるため、曖昧性がある自然言語処理の問題がある。
– このプロジェクトでは、匿名化されたメンタルヘルスの電子健康記録データを使用し、患者の痛みについての議論が含まれる文章を分類する機械学習ベースの分類アルゴリズムを訓練することを目的としている。
– このアルゴリズムにより、大規模なデータベースから関連する痛みに関する情報を抽出し、その結果をさらに痛みとメンタルヘルスに関する研究に利用することができる。
– 1,985の文書が手動でトリプルアノテーションされ、トレーニングデータの作成に使用され、3つの一般的に使用される分類アルゴリズムを訓練した。最も優れた性能を発揮したモデルは、F1得点が0.98(95%CI 0.98〜0.99)であった。

要約(オリジナル)

Pain is a common reason for accessing healthcare resources and is a growing area of research, especially in its overlap with mental health. Mental health electronic health records are a good data source to study this overlap. However, much information on pain is held in the free text of these records, where mentions of pain present a unique natural language processing problem due to its ambiguous nature. This project uses data from an anonymised mental health electronic health records database. The data are used to train a machine learning based classification algorithm to classify sentences as discussing patient pain or not. This will facilitate the extraction of relevant pain information from large databases, and the use of such outputs for further studies on pain and mental health. 1,985 documents were manually triple-annotated for creation of gold standard training data, which was used to train three commonly used classification algorithms. The best performing model achieved an F1-score of 0.98 (95% CI 0.98-0.99).

arxiv情報

著者 Jaya Chaturvedi,Sumithra Velupillai,Robert Stewart,Angus Roberts
発行日 2023-04-03 11:56:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG パーマリンク