A Survey on Biomedical Text Summarization with Pre-trained Language Model

要約

タイトル:プレトレーニングモデルを用いたバイオメディカルテキスト要約に関するまとめ

要約:
– バイオメディカル文献や電子医療記録などのバイオメディカルテキストの急速な増加が、臨床医や研究者にとって効率的な臨床情報のアクセスを困難にしている。
– この問題を解決するため、バイオメディカルテキスト要約が提案されており、単一または複数のバイオメディカルドキュメントから主要な情報を取り出す簡潔な要約文を生成することを目的としている。
– 近年、プレトレーニングモデル(PLMs)は、一般ドメインの自然言語処理タスクのデファクトスタンダードとなっており、バイオメディカル分野でもさらなる研究が進んでいる。
– 本論文では、PLMsを利用したバイオメディカルテキスト要約の最近の進歩、課題、将来の方向性を整理し、分類、データセット、最近のアプローチ、評価指標について説明する。
– 課題や将来の方向性に対しても議論を行い、研究コミュニティに役立てるために、公開プロジェクトhttps://github.com/KenZLuo/Biomedical-Text-Summarization-Survey/tree/masterに、利用可能なデータセット、最近のアプローチ、コード、評価指標、ランキングなどの情報をまとめた。

要約(オリジナル)

The exponential growth of biomedical texts such as biomedical literature and electronic health records (EHRs), provides a big challenge for clinicians and researchers to access clinical information efficiently. To address the problem, biomedical text summarization has been proposed to support clinical information retrieval and management, aiming at generating concise summaries that distill key information from single or multiple biomedical documents. In recent years, pre-trained language models (PLMs) have been the de facto standard of various natural language processing tasks in the general domain. Most recently, PLMs have been further investigated in the biomedical field and brought new insights into the biomedical text summarization task. In this paper, we systematically summarize recent advances that explore PLMs for biomedical text summarization, to help understand recent progress, challenges, and future directions. We categorize PLMs-based approaches according to how they utilize PLMs and what PLMs they use. We then review available datasets, recent approaches and evaluation metrics of the task. We finally discuss existing challenges and promising future directions. To facilitate the research community, we line up open resources including available datasets, recent approaches, codes, evaluation metrics, and the leaderboard in a public project: https://github.com/KenZLuo/Biomedical-Text-Summarization-Survey/tree/master.

arxiv情報

著者 Qianqian Xie,Zheheng Luo,Benyou Wang,Sophia Ananiadou
発行日 2023-04-18 06:38:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク