要約
大量に公開された化学特許とその情報をタイムリーに取得することが重要であるため、化学特許からの情報抽出の自動化が進められています。
照応解像度は包括的な情報抽出の重要な要素であり、反応を抽出するために重要です。
化学特許では、共参照、変換、関連反応、ワークアップ、および包含という 5 つの照応関係が対象となります。
私たちの目標は、化学特許の反応テキストの照応解像度モデルのパフォーマンスがノイズのない環境とノイズのある環境でどのように異なるか、またモデルのノイズに対するロバスト性をどの程度改善できるかを調査することです。
要約(オリジナル)
The high volume of published chemical patents and the importance of a timely acquisition of their information gives rise to automating information extraction from chemical patents. Anaphora resolution is an important component of comprehensive information extraction, and is critical for extracting reactions. In chemical patents, there are five anaphoric relations of interest: co-reference, transformed, reaction associated, work up, and contained. Our goal is to investigate how the performance of anaphora resolution models for reaction texts in chemical patents differs in a noise-free and noisy environment and to what extent we can improve the robustness against noise of the model.
arxiv情報
著者 | Chieling Yueh,Evangelos Kanoulas,Bruno Martins,Camilo Thorne,Saber Akhondi |
発行日 | 2023-06-23 09:01:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google