Biomedical Entity Linking as Multiple Choice Question Answering

要約

生物医学エンティティ リンク (BioEL) は、事前トレーニングされた言語モデルによって大幅に進歩しましたが、きめの細かいロングテール エンティティには依然として課題が存在します。
これらの課題に対処するために、私たちは生物医学エンティティのリンクを多肢選択式の質問応答として扱う新しいモデルである BioELQA を紹介します。
BioELQA は、まず高速検索機能を使用して候補エンティティを取得し、言及エンティティと候補エンティティを一緒にジェネレータに提示して、選択したエンティティに関連付けられた予測シンボルを出力します。
この定式化により、さまざまな候補エンティティの明示的な比較が可能になり、言及とエンティティの間、およびエンティティ自体の間のきめ細かい相互作用を捕捉できます。
ロングテール エンティティの一般化を改善するために、同様のラベル付きトレーニング インスタンスを手がかりとして取得し、ジェネレーターの入力と取得されたインスタンスを連結します。
広範な実験結果は、BioELQA がいくつかのデータセットで最先端のベースラインを上回るパフォーマンスを示していることを示しています。

要約(オリジナル)

Although biomedical entity linking (BioEL) has made significant progress with pre-trained language models, challenges still exist for fine-grained and long-tailed entities. To address these challenges, we present BioELQA, a novel model that treats Biomedical Entity Linking as Multiple Choice Question Answering. BioELQA first obtains candidate entities with a fast retriever, jointly presents the mention and candidate entities to a generator, and then outputs the predicted symbol associated with its chosen entity. This formulation enables explicit comparison of different candidate entities, thus capturing fine-grained interactions between mentions and entities, as well as among entities themselves. To improve generalization for long-tailed entities, we retrieve similar labeled training instances as clues and concatenate the input with retrieved instances for the generator. Extensive experimental results show that BioELQA outperforms state-of-the-art baselines on several datasets.

arxiv情報

著者 Zhenxi Lin,Ziheng Zhang,Xian Wu,Yefeng Zheng
発行日 2024-05-17 09:11:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク