BioDEX: Large-Scale Biomedical Adverse Drug Event Extraction for Real-World Pharmacovigilance

要約

生物医学文献から薬物有害事象 (ADE) をタイムリーかつ正確に抽出することは公共の安全にとって最も重要ですが、時間とコストがかかる手作業が必要です。
私たちは、自然言語処理 (NLP) の使用を通じて医薬品安全性監視 (ファーマコビジランス、PV) を改善することに着手しました。
米国における医薬品安全性報告の歴史的成果に根ざした、生物医学的有害事象抽出のための大規模リソースである BioDEX を紹介します。BioDEX は、65,000 の抄録と 19,000 の生物医学論文の全文で構成されており、関連する文書レベルの安全性レポートは 256,000 件作成されています。
医療専門家。
これらのレポートの中核となる機能には、報告された患者の体重、年齢、生物学的性別、患者が服用した一連の薬剤、薬剤の投与量、経験した反応、およびその反応が生命を脅かすかどうかが含まれます。
この作業では、元の論文を考慮してレポートの中核となる情報を予測するタスクを検討します。
人間のパフォーマンスは 72.0% F1 であると推定されていますが、最良のモデルは 62.3% F1 を達成しており、このタスクでは大きな余裕があることがわかります。
また、これらのモデルがプロの PV レビュー担当者に役立つ方法の探索も開始します。
コードとデータは https://github.com/KarelDO/BioDEX から入手できます。

要約(オリジナル)

Timely and accurate extraction of Adverse Drug Events (ADE) from biomedical literature is paramount for public safety, but involves slow and costly manual labor. We set out to improve drug safety monitoring (pharmacovigilance, PV) through the use of Natural Language Processing (NLP). We introduce BioDEX, a large-scale resource for Biomedical adverse Drug Event Extraction, rooted in the historical output of drug safety reporting in the U.S. BioDEX consists of 65k abstracts and 19k full-text biomedical papers with 256k associated document-level safety reports created by medical experts. The core features of these reports include the reported weight, age, and biological sex of a patient, a set of drugs taken by the patient, the drug dosages, the reactions experienced, and whether the reaction was life threatening. In this work, we consider the task of predicting the core information of the report given its originating paper. We estimate human performance to be 72.0% F1, whereas our best model achieves 62.3% F1, indicating significant headroom on this task. We also begin to explore ways in which these models could help professional PV reviewers. Our code and data are available: https://github.com/KarelDO/BioDEX.

arxiv情報

著者 Karel D’Oosterlinck,François Remy,Johannes Deleu,Thomas Demeester,Chris Develder,Klim Zaporojets,Aneiss Ghodsi,Simon Ellershaw,Jack Collins,Christopher Potts
発行日 2023-10-20 15:51:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク