A Survey of Large Language Models in Medicine: Progress, Application, and Challenge

要約

ChatGPTのような大規模言語モデル(LLM)は、人間の言語を理解し生成する能力を持つことから、大きな注目を集めている。様々な医療タスク(例えば、臨床診断の強化や医療教育の提供)をサポートするためにLLMを採用することに焦点を当てた研究が急増している一方で、これらの取り組み、特にその開発、実用的なアプリケーション、および医療における成果のレビューはまだ不足している。そこで本総説では、LLMが直面する課題と機会を含め、医療におけるLLMの開発と展開の詳細な概要を提供することを目的とする。開発に関しては、基本的なモデル構造、パラメータの数、モデル開発に使用されるデータのソースとスケールなど、既存の医療LLMの原理について詳しく紹介する。これは、医療LLMを開発する際のガイドとなる。また、医療におけるLLMの利点と限界を理解することを目的として、様々な医療タスクにおける様々なLLMのパフォーマンスを比較し、さらに最先端の軽量モデルと比較する。全体として、本総説では以下の疑問を取り上げる:1) 医療用LLMの開発にはどのような方法があるか? 2) 医療現場におけるLLMの医療タスクのパフォーマンスをどのように測定するか?3) 実際の医療現場でLLMはどのように使用されているか?4) 医療LLMを使用することでどのような課題が生じるのか? 5) 医療LLMをより効果的に開発・展開するにはどうすればよいのか?これらの疑問に答えることで、このレビューは、医学におけるLLMの機会に関する洞察を提供し、実践的なリソースとして役立つことを目的としている。私たちはまた、医学LLMに関する実践的なガイドの定期的な更新リストをhttps://github.com/AI-in-Health/MedLLMsPracticalGuide。

要約(オリジナル)

Large language models (LLMs), such as ChatGPT, have received substantial attention due to their capabilities for understanding and generating human language. While there has been a burgeoning trend in research focusing on the employment of LLMs in supporting different medical tasks (e.g., enhancing clinical diagnostics and providing medical education), a review of these efforts, particularly their development, practical applications, and outcomes in medicine, remains scarce. Therefore, this review aims to provide a detailed overview of the development and deployment of LLMs in medicine, including the challenges and opportunities they face. In terms of development, we provide a detailed introduction to the principles of existing medical LLMs, including their basic model structures, number of parameters, and sources and scales of data used for model development. It serves as a guide for practitioners in developing medical LLMs tailored to their specific needs. In terms of deployment, we offer a comparison of the performance of different LLMs across various medical tasks, and further compare them with state-of-the-art lightweight models, aiming to provide an understanding of the advantages and limitations of LLMs in medicine. Overall, in this review, we address the following questions: 1) What are the practices for developing medical LLMs 2) How to measure the medical task performance of LLMs in a medical setting? 3) How have medical LLMs been employed in real-world practice? 4) What challenges arise from the use of medical LLMs? and 5) How to more effectively develop and deploy medical LLMs? By answering these questions, this review aims to provide insights into the opportunities for LLMs in medicine and serve as a practical resource. We also maintain a regularly updated list of practical guides on medical LLMs at: https://github.com/AI-in-Health/MedLLMsPracticalGuide.

arxiv情報

著者 Hongjian Zhou,Fenglin Liu,Boyang Gu,Xinyu Zou,Jinfa Huang,Jinge Wu,Yiru Li,Sam S. Chen,Peilin Zhou,Junling Liu,Yining Hua,Chengfeng Mao,Chenyu You,Xian Wu,Yefeng Zheng,Lei Clifton,Zheng Li,Jiebo Luo,David A. Clifton
発行日 2024-03-03 01:15:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク