要約
フリーテキストセンテンスからの臨床関係抽出に関する以前の研究は、エンティティ表現の一部として臨床知識ベースからのセマンティックタイプに関する情報を活用しました。
この論文では、ドメイン固有のセマンティックタイプの依存関係を使用することにより、追加の証拠を活用します。
統一された医療言語システム(UMLS)の概念と文の他のトークンと一致するトークンのスパンとの関係をエンコードします。
さまざまな訓練を受けた臨床埋め込み(つまり、Bert、Biobert、Umlsbert)を使用して、さまざまな名前付きエンティティ認識(NER)アーキテクチャ(つまり、Bilstm-CRFおよびBILSTM-GCN-CRF)と比較します。
臨床データセットでの実験結果は、場合によっては、ドメイン固有のセマンティックタイプの依存関係を利用することにより、NERの有効性が大幅に改善できることを示しています。
私たちの作業は、NERタスクの1つのパスで3つ以上の依存関係を使用するためのマトリックスエンコードを生成する最初の研究でもあります。
要約(オリジナル)
Previous work on clinical relation extraction from free-text sentences leveraged information about semantic types from clinical knowledge bases as a part of entity representations. In this paper, we exploit additional evidence by also making use of domain-specific semantic type dependencies. We encode the relation between a span of tokens matching a Unified Medical Language System (UMLS) concept and other tokens in the sentence. We implement our method and compare against different named entity recognition (NER) architectures (i.e., BiLSTM-CRF and BiLSTM-GCN-CRF) using different pre-trained clinical embeddings (i.e., BERT, BioBERT, UMLSBert). Our experimental results on clinical datasets show that in some cases NER effectiveness can be significantly improved by making use of domain-specific semantic type dependencies. Our work is also the first study generating a matrix encoding to make use of more than three dependencies in one pass for the NER task.
arxiv情報
著者 | Linh Le,Guido Zuccon,Gianluca Demartini,Genghong Zhao,Xia Zhang |
発行日 | 2025-03-07 12:29:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google