要約
完全なテキストではなく特定の事実に焦点を当てると、科学文献内の特定の情報の検索が向上する可能性があります。
特に、議論的な要素を使用すると、背景セクションや著者の主張など、出版物の特定の部分に焦点を当てることができます。
私たちは、生物医学における特定のタスクに関する議論要素を抽出するためのツール、つまり、生物医学出版物における応用分野、たとえば、病気の診断の問題を扱っているか、医薬品開発の問題を扱っているかどうかを検出するためのいくつかのツールを評価しました。
私たちは、タスク用に特定のコーパスで微調整された PubMedBERT 事前トレーニング済みモデルを使用して実験を実行しました。
タイトルと要約の使用を、いくつかの議論要素のみに制限することと比較しました。
最高の F1 スコアは、応用分野に応じて 0.22 ~ 0.84 の範囲でした。
最も議論に富んだラベルは、要約の結論と背景セクションに関連するラベルでした。
要約(オリジナル)
Focusing on particular facts, instead of the complete text, can potentially improve searching for specific information in the scientific literature. In particular, argumentative elements allow focusing on specific parts of a publication, e.g., the background section or the claims from the authors. We evaluated some tools for the extraction of argumentation elements for a specific task in biomedicine, namely, for detecting the fields of the application in a biomedical publication, e.g, whether it addresses the problem of disease diagnosis or drug development. We performed experiments with the PubMedBERT pre-trained model, which was fine-tuned on a specific corpus for the task. We compared the use of title and abstract to restricting to only some argumentative elements. The top F1 scores ranged from 0.22 to 0.84, depending on the field of application. The best argumentative labels were the ones related the conclusion and background sections of an abstract.
arxiv情報
著者 | Mariana Neves |
発行日 | 2024-04-09 08:44:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google