End-to-End $n$-ary Relation Extraction for Combination Drug Therapies

要約

併用薬物療法は、がん、HIV、マラリア、または結核の患者に対してより一般的に投与される、2 つ以上の薬物を含む治療レジメンです。
現在、PubMed には 350,000 件を超える記事があり、「併用薬物療法」MeSH の見出しを使用しており、過去 20 年間に年間少なくとも 10,000 件の記事が公開されています。
科学文献から併用療法を抽出することは、本質的に $n$-ary 関係抽出問題を構成します。
$n$ が固定されている一般的な $n$-ary 設定 (例: $n=3$ の場合の薬物遺伝子変異関係) とは異なり、併用療法の抽出は $n \geq 2$ が動的な特別な設定です。
各インスタンスに応じて。
最近、Tiktinsky等。
(NAACL 2022) は、文献からそのような治療法を抽出するために、この種のデータセットとしては初の CombDrugExt を導入しました。
ここでは、sequence-to-sequence スタイルの end-to-end 抽出方法を使用して、CombDrugExt テスト セットで正の (または効果的な) 組み合わせの F1 スコア $66.7\%$ を達成します。
これは、スポットされた薬物エンティティを使用した以前の最良の関係分類スコアよりも、絶対 $\approx 5\%$ F1 スコアが改善されています (したがって、エンド ツー エンドではありません)。
したがって、私たちの努力は、このタスクの以前の最良の非エンドツーエンドモデルよりもすでに優れている、エンドツーエンド抽出のための最先端の最初のモデルを導入します。
私たちのモデルは、すべての薬物エンティティと関係を 1 回のパスでシームレスに抽出し、動的な $n$-ary 抽出シナリオに非常に適しています。

要約(オリジナル)

Combination drug therapies are treatment regimens that involve two or more drugs, administered more commonly for patients with cancer, HIV, malaria, or tuberculosis. Currently there are over 350K articles in PubMed that use the ‘combination drug therapy’ MeSH heading with at least 10K articles published per year over the past two decades. Extracting combination therapies from scientific literature inherently constitutes an $n$-ary relation extraction problem. Unlike in the general $n$-ary setting where $n$ is fixed (e.g., drug-gene-mutation relations where $n=3$), extracting combination therapies is a special setting where $n \geq 2$ is dynamic, depending on each instance. Recently, Tiktinsky et al. (NAACL 2022) introduced a first of its kind dataset, CombDrugExt, for extracting such therapies from literature. Here, we use a sequence-to-sequence style end-to-end extraction method to achieve an F1-Score of $66.7\%$ on the CombDrugExt test set for positive (or effective) combinations. This is an absolute $\approx 5\%$ F1-score improvement even over the prior best relation classification score with spotted drug entities (hence, not end-to-end). Thus our effort introduces a state-of-the-art first model for end-to-end extraction that is already superior to the best prior non end-to-end model for this task. Our model seamlessly extracts all drug entities and relations in a single pass and is highly suitable for dynamic $n$-ary extraction scenarios.

arxiv情報

著者 Yuhang Jiang,Ramakanth Kavuluru
発行日 2023-03-29 17:55:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク