Benchingmaking Large Langage Models in Biomedical Triple Extraction

要約

生物医学トリプル抽出システムは、生物医学エンティティとエンティティ間の関係を自動的に抽出することを目的としています。
大規模言語モデル (LLM) をトリプル抽出に適用する方法の検討は、まだ比較的未開発です。
この作業では、主に文レベルの生物医学トリプル抽出に焦点を当てます。
さらに、高品質の生物医学トリプル抽出データセットが存在しないため、堅牢なトリプル抽出システムの開発の進歩が妨げられています。
これらの課題に対処するために、最初に、さまざまな大規模な言語モデルのパフォーマンスを比較します。
さらに、より広範囲の関係タイプをカバーする、専門家による注釈付きの生物医学トリプル抽出データセットである GIT を紹介します。

要約(オリジナル)

Biomedical triple extraction systems aim to automatically extract biomedical entities and relations between entities. The exploration of applying large language models (LLM) to triple extraction is still relatively unexplored. In this work, we mainly focus on sentence-level biomedical triple extraction. Furthermore, the absence of a high-quality biomedical triple extraction dataset impedes the progress in developing robust triple extraction systems. To address these challenges, initially, we compare the performance of various large language models. Additionally, we present GIT, an expert-annotated biomedical triple extraction dataset that covers a wider range of relation types.

arxiv情報

著者 Mingchen Li,Huixue Zhou,Rui Zhang
発行日 2024-04-17 12:03:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク