A Review on Scientific Knowledge Extraction using Large Language Models in Biomedical Sciences

要約

大規模言語モデル (LLM) の急速な進歩により、特に証拠の合成において、医学知識の抽出と合成において新たな境界が開かれました。
この論文では、生物医学分野における LLM の最先端のアプリケーションをレビューし、証拠の合成や生物医学文書のコーパスからのデータ抽出などの複雑なタスクの自動化における LLM の有効性を調査します。
LLM は注目に値する可能性を示していますが、幻覚、状況理解、さまざまな医療タスクにわたって一般化する能力に関連する問題など、大きな課題が残されています。
現在の研究文献にある重大なギャップ、特に評価を標準化し、実世界のアプリケーションの信頼性を確保するための統一ベンチマークの必要性を強調します。
さらに、証拠合成における LLM パフォーマンスを向上させるための検索拡張生成 (RAG) などの最先端技術の統合を強調し、将来の研究の方向性を提案します。
これらの課題に対処し、LLM の強みを活用することで、私たちは医学文献へのアクセスを改善し、医療における有意義な発見を促進することを目指しています。

要約(オリジナル)

The rapid advancement of large language models (LLMs) has opened new boundaries in the extraction and synthesis of medical knowledge, particularly within evidence synthesis. This paper reviews the state-of-the-art applications of LLMs in the biomedical domain, exploring their effectiveness in automating complex tasks such as evidence synthesis and data extraction from a biomedical corpus of documents. While LLMs demonstrate remarkable potential, significant challenges remain, including issues related to hallucinations, contextual understanding, and the ability to generalize across diverse medical tasks. We highlight critical gaps in the current research literature, particularly the need for unified benchmarks to standardize evaluations and ensure reliability in real-world applications. In addition, we propose directions for future research, emphasizing the integration of state-of-the-art techniques such as retrieval-augmented generation (RAG) to enhance LLM performance in evidence synthesis. By addressing these challenges and utilizing the strengths of LLMs, we aim to improve access to medical literature and facilitate meaningful discoveries in healthcare.

arxiv情報

著者 Gabriel Lino Garcia,João Renato Ribeiro Manesco,Pedro Henrique Paiola,Lucas Miranda,Maria Paola de Salvo,João Paulo Papa
発行日 2024-12-04 18:26:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク