Extraction of Medication and Temporal Relation from Clinical Text by Harnessing Different Deep Learning Models

要約

電子カルテ(EMR)で表現される臨床テキストは、豊富な医療情報を含んでおり、疾患予測、パーソナライズされた情報推薦、臨床判断支援、投薬パターンのマイニングと測定に不可欠である。投薬の言及と時間的情報との間の関係抽出は、臨床医が患者の治療歴をより良く理解するのをさらに助けることができる。薬の抽出と時間的関係の分類における深層学習(DL)と大規模言語モデル(LLM)の性能を評価するために、我々は、異なる単語埋め込み技術の探求に加えて、臨床ドメインの名前付きエンティティ認識(NER)のためのBiLSTM-CRFとCNN-BiLSTM、および時間的関係抽出(RE)のためのBERT-CNNを含むいくつかの高度な学習構造を使用して、ⅳtextbf{MedTem}プロジェクトの実証的調査を実施します。さらに、我々は、薬と時間的関係に関する構造化された出力を生成するための後処理の役割も設計した。実験によると、i2b2-2009臨床NERタスクにおいて、CNN-BiLSTMはBiLSTM-CRFモデルにわずかに勝利し、マクロ平均を用いた精度は75.67、再現率は77.83、F1スコアは78.17であった。BERT-CNN モデルも、i2b2-2012 チャレンジの時間関係抽出テストセットで、Macro Avg を使用して、P/R/F1 で 64.48、67.17、65.03 の妥当な評価スコアを得た。MedTemのコードとツールは⽋⽋でホストされます。

要約(オリジナル)

Clinical texts, represented in electronic medical records (EMRs), contain rich medical information and are essential for disease prediction, personalised information recommendation, clinical decision support, and medication pattern mining and measurement. Relation extractions between medication mentions and temporal information can further help clinicians better understand the patients’ treatment history. To evaluate the performances of deep learning (DL) and large language models (LLMs) in medication extraction and temporal relations classification, we carry out an empirical investigation of \textbf{MedTem} project using several advanced learning structures including BiLSTM-CRF and CNN-BiLSTM for a clinical domain named entity recognition (NER), and BERT-CNN for temporal relation extraction (RE), in addition to the exploration of different word embedding techniques. Furthermore, we also designed a set of post-processing roles to generate structured output on medications and the temporal relation. Our experiments show that CNN-BiLSTM slightly wins the BiLSTM-CRF model on the i2b2-2009 clinical NER task yielding 75.67, 77.83, and 78.17 for precision, recall, and F1 scores using Macro Average. BERT-CNN model also produced reasonable evaluation scores 64.48, 67.17, and 65.03 for P/R/F1 using Macro Avg on the temporal relation extraction test set from i2b2-2012 challenges. Code and Tools from MedTem will be hosted at \url{https://github.com/HECTA-UoM/MedTem}

arxiv情報

著者 Hangyu Tu,Lifeng Han,Goran Nenadic
発行日 2023-10-03 17:37:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク