Advancing Chinese biomedical text mining with community challenges

要約

目的: この研究は、中国における生物医学テキストマイニングに対するコミュニティの課題における最近の進歩をレビューすることを目的としています。
方法:生物医学テキストマイニングのコミュニティチャレンジでリリースされた評価タスクの情報(タスクの説明、データセットの説明、データソース、タスクタイプ、関連リンクなど)を収集しました。
固有表現認識、表現正規化、属性抽出、関係抽出、イベント抽出、テキスト分類、テキスト類似性、ナレッジグラフ構築、質問応答、テキスト生成、
そして大規模な言語モデルの評価。
結果: 2017 年から 2023 年にわたる 6 つのコミュニティ課題から 39 の評価タスクを特定しました。分析により、生物医学テキスト マイニングにおける評価タスクの種類とデータ ソースが多様であることが明らかになりました。
私たちは、トランスレーショナル生物医学情報学の観点から、これらのコミュニティ課題タスクの潜在的な臨床応用を調査しました。
私たちは英語の言語と比較し、これらのコミュニティの課題の貢献、限界、教訓、ガイドラインについて議論し、大規模な言語モデルの時代における将来の方向性を強調しました。
結論: コミュニティの課題評価コンテストは、生物医学テキストマイニングの分野で技術革新を促進し、学際的な協力を促進する上で重要な役割を果たしてきました。
これらの課題は、研究者が最先端のソリューションを開発するための貴重なプラットフォームを提供します。

要約(オリジナル)

Objective: This study aims to review the recent advances in community challenges for biomedical text mining in China. Methods: We collected information of evaluation tasks released in community challenges of biomedical text mining, including task description, dataset description, data source, task type and related links. A systematic summary and comparative analysis were conducted on various biomedical natural language processing tasks, such as named entity recognition, entity normalization, attribute extraction, relation extraction, event extraction, text classification, text similarity, knowledge graph construction, question answering, text generation, and large language model evaluation. Results: We identified 39 evaluation tasks from 6 community challenges that spanned from 2017 to 2023. Our analysis revealed the diverse range of evaluation task types and data sources in biomedical text mining. We explored the potential clinical applications of these community challenge tasks from a translational biomedical informatics perspective. We compared with their English counterparts, and discussed the contributions, limitations, lessons and guidelines of these community challenges, while highlighting future directions in the era of large language models. Conclusion: Community challenge evaluation competitions have played a crucial role in promoting technology innovation and fostering interdisciplinary collaboration in the field of biomedical text mining. These challenges provide valuable platforms for researchers to develop state-of-the-art solutions.

arxiv情報

著者 Hui Zong,Rongrong Wu,Jiaxue Cha,Weizhe Feng,Erman Wu,Jiakun Li,Aibin Shao,Liang Tao,Zuofeng Li,Buzhou Tang,Bairong Shen
発行日 2024-08-30 02:47:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク