An Event Structure-aware Generative Model for Biomedical Event Extraction


生物医学イベント抽出 (BEE) は、生物医学テキスト内のきめの細かいエンティティ間の複雑な関係をモデル化することを含む、やりがいのあるタスクです。
BEE は伝統的に分類問題として定式化されてきました。
大規模言語モデル (LLM) の最近の技術進歩により、イベント抽出をシーケンス生成問題として扱う生成ベースのモデルが、NLP 研究コミュニティから大きな注目を集めています。
ただし、現在の生成モデルでは、ベンチマーク データセットに大きく寄与する、ネストされたイベントや重複するイベントなどの複雑なイベント構造からのインスタンス間情報の重要性が見落とされることがよくあります。
この論文では、生物医学テキスト内の複雑なイベント構造を捕捉して生物医学イベントを抽出できる、GenBEE と呼ばれるイベント構造認識生成モデルを提案します。
特に、GenBEE は、ラベルのセマンティクスと引数の依存関係の両方を提案されたモデルに組み込むための知識を LLM から抽出するイベント プロンプトを構築します。
さらに、GenBEE は、モデルの全体的なパフォーマンスを向上させるための構造的特徴を組み込むためのイベント構造プロンプトを含むプレフィックスも生成します。
我々は、広く使用されている 3 つの生物医学的イベント抽出ベンチマーク データセット、つまり MLEE、GE11、および PHEE で提案された GenBEE モデルを評価しました。
実験結果は、GenBEE が MLEE および GE11 データセットで最先端のパフォーマンスを達成し、PHEE データセットでの最先端の分類ベースのモデルと比較して競争力のある結果を達成したことを示しています。


Biomedical Event Extraction (BEE) is a challenging task that involves modeling complex relationships between fine-grained entities in biomedical text. BEE has traditionally been formulated as a classification problem. With the recent technological advancements in large language models (LLMs), generation-based models that cast event extraction as a sequence generation problem have attracted much attention from the NLP research communities. However, current generative models often overlook the importance of cross-instance information from complex event structures such as nested events and overlapping events, which contribute quite significantly in the benchmark datasets. In this paper, we propose an event structure-aware generative model called GenBEE, which can capture complex event structures in biomedical text for biomedical event extraction. In particular, GenBEE constructs event prompts that distill knowledge from LLMs for incorporating both label semantics and argument dependency relationships into the proposed model. In addition, GenBEE also generates prefixes with event structural prompts to incorporate structural features for improving the model’s overall performance. We have evaluated the proposed GenBEE model on three widely used biomedical event extraction benchmark datasets, namely MLEE, GE11, and PHEE. Experimental results show that GenBEE has achieved state-of-the-art performance on the MLEE and GE11 datasets, and achieved competitive results when compared to the state-of-the-art classification-based models on the PHEE dataset.


著者 Haohan Yuan,Siu Cheung Hui,Haopeng Zhang
発行日 2024-08-15 15:24:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク