Leveraging Natural Language Processing to Augment Structured Social Determinants of Health Data in the Electronic Health Record

要約

タイトル: 自然言語処理を用いた電子カルテ内での構造化された社会的健康決定要因データの補完

要約:

この論文は、自然言語処理(NLP)を使用して電子カルテの構造化された健康決定要因(SDOH)データを補完する方法を調べたものです。

主な目的は、以下の2点です。

– 明確なSDOH情報を抽出するためのNLP情報抽出モデルを開発すること
– SDOHエクストラクタを臨床的な物語に適用して抽出された表現と既存の構造化データを組み合わせて得られる情報の収集効率を評価すること

研究では、深層学習エンティティおよび関係抽出アーキテクチャを使用して、様々な次元でSDOHを特徴付けるSDOHエクストラクタを開発しました。次に、SDOHエクストラクタを大量の臨床データに適用し、既存の構造化データと比較しました。

結果として、SDOHエクストラクタは、テストセット上で0.86のF1スコアを達成し、家庭不安定やたばこ使用、薬物使用などの健康リスク要因がクリニカルノートにしか記載されていない患者がおり、既存の構造化データを補完することができることが示されました。

このようなSDOH情報を集めることができれば、患者のケアとアウトカムを改善することができると期待されます。特にテキストエンコードされたSDOH情報の意味的表現が、これらの社会的ニーズを特定して解決するために健康システムのために役立つでしょう。

要約(オリジナル)

Objective: Social determinants of health (SDOH) impact health outcomes and are documented in the electronic health record (EHR) through structured data and unstructured clinical notes. However, clinical notes often contain more comprehensive SDOH information, detailing aspects such as status, severity, and temporality. This work has two primary objectives: i) develop a natural language processing (NLP) information extraction model to capture detailed SDOH information and ii) evaluate the information gain achieved by applying the SDOH extractor to clinical narratives and combining the extracted representations with existing structured data. Materials and Methods: We developed a novel SDOH extractor using a deep learning entity and relation extraction architecture to characterize SDOH across various dimensions. In an EHR case study, we applied the SDOH extractor to a large clinical data set with 225,089 patients and 430,406 notes with social history sections and compared the extracted SDOH information with existing structured data. Results: The SDOH extractor achieved 0.86 F1 on a withheld test set. In the EHR case study, we found extracted SDOH information complements existing structured data with 32% of homeless patients, 19% of current tobacco users, and 10% of drug users only having these health risk factors documented in the clinical narrative. Conclusions: Utilizing EHR data to identify SDOH health risk factors and social needs may improve patient care and outcomes. Semantic representations of text-encoded SDOH information can augment existing structured data, and this more comprehensive SDOH representation can assist health systems in identifying and addressing these social needs.

arxiv情報

著者 Kevin Lybarger,Nicholas J Dobbins,Ritche Long,Angad Singh,Patrick Wedgeworth,Ozlem Ozuner,Meliha Yetisgen
発行日 2023-04-14 17:04:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク