併用薬物療法は、がん、HIV、マラリア、または結核の患者に対してより一般的に投与される、2 つ以上の薬物を含む治療レジメンです。
現在、PubMed には 350,000 件を超える記事があり、「併用薬物療法」MeSH の見出しを使用しており、過去 20 年間に年間少なくとも 10,000 件の記事が公開されています。
科学文献から併用療法を抽出することは、本質的に $n$-ary 関係抽出問題を構成します。
$n$ が固定されている一般的な $n$-ary 設定 (例: $n=3$ の場合の薬物遺伝子変異関係) とは異なり、併用療法の抽出は $n \geq 2$ が動的な特別な設定です。
(NAACL 2022) は、文献からそのような治療法を抽出するために、この種のデータセットとしては初の CombDrugExt を導入しました。
ここでは、sequence-to-sequence スタイルの end-to-end 抽出方法を使用して、CombDrugExt テスト セットで正の (または効果的な) 組み合わせの F1 スコア $66.7\%$ を達成します。
これは、スポットされた薬物エンティティを使用した以前の最良の関係分類スコアよりも、絶対 $\approx 5\%$ F1 スコアが改善されています (したがって、エンド ツー エンドではありません)。
私たちのモデルは、すべての薬物エンティティと関係を 1 回のパスでシームレスに抽出し、動的な $n$-ary 抽出シナリオに非常に適しています。
Combination drug therapies are treatment regimens that involve two or more drugs, administered more commonly for patients with cancer, HIV, malaria, or tuberculosis. Currently there are over 350K articles in PubMed that use the ‘combination drug therapy’ MeSH heading with at least 10K articles published per year over the past two decades. Extracting combination therapies from scientific literature inherently constitutes an $n$-ary relation extraction problem. Unlike in the general $n$-ary setting where $n$ is fixed (e.g., drug-gene-mutation relations where $n=3$), extracting combination therapies is a special setting where $n \geq 2$ is dynamic, depending on each instance. Recently, Tiktinsky et al. (NAACL 2022) introduced a first of its kind dataset, CombDrugExt, for extracting such therapies from literature. Here, we use a sequence-to-sequence style end-to-end extraction method to achieve an F1-Score of $66.7\%$ on the CombDrugExt test set for positive (or effective) combinations. This is an absolute $\approx 5\%$ F1-score improvement even over the prior best relation classification score with spotted drug entities (hence, not end-to-end). Thus our effort introduces a state-of-the-art first model for end-to-end extraction that is already superior to the best prior non end-to-end model for this task. Our model seamlessly extracts all drug entities and relations in a single pass and is highly suitable for dynamic $n$-ary extraction scenarios.
著者 | Yuhang Jiang,Ramakanth Kavuluru |
発行日 | 2023-03-29 17:55:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google