EHRKit: A Python Natural Language Processing Toolkit for Electronic Health Record Texts

要約

電子医療記録 (EHR) は現代の医療システムの重要な部分であり、医療の提供、運営、研究に影響を与えます。
EHR の構造化情報にもかかわらず、非構造化テキストは大きな注目を集めており、刺激的な研究分野となっています。
最近のニューラル自然言語処理 (NLP) 手法の成功により、非構造化臨床ノートの処理に新たな方向性が生まれました。
この作業では、臨床テキスト用の Python ライブラリである EHRKit を作成します。
このライブラリには、MIMIC-III 固有の関数とタスク固有の関数という 2 つの主要な部分が含まれています。
最初の部分では、基本的な検索、情報検索、情報抽出など、MIMIC-III NOTEEVENTS データにアクセスするためのインターフェイスのリストを紹介します。
2 番目の部分では、固有表現認識、要約、機械翻訳など、最大 12 個の既製 NLP タスク用の多くのサードパーティ ライブラリが統合されています。

要約(オリジナル)

The Electronic Health Record (EHR) is an essential part of the modern medical system and impacts healthcare delivery, operations, and research. Unstructured text is attracting much attention despite structured information in the EHRs and has become an exciting research field. The success of the recent neural Natural Language Processing (NLP) method has led to a new direction for processing unstructured clinical notes. In this work, we create a python library for clinical texts, EHRKit. This library contains two main parts: MIMIC-III-specific functions and tasks specific functions. The first part introduces a list of interfaces for accessing MIMIC-III NOTEEVENTS data, including basic search, information retrieval, and information extraction. The second part integrates many third-party libraries for up to 12 off-shelf NLP tasks such as named entity recognition, summarization, machine translation, etc.

arxiv情報

著者 Irene Li,Keen You,Yujie Qiao,Lucas Huang,Chia-Chun Hsieh,Benjamin Rosand,Jeremy Goldwasser,Dragomir Radev
発行日 2023-06-28 03:03:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク