A Survey of Large Language Models in Medicine: Progress, Application, and Challenge

要約

ChatGPT などの大規模言語モデル (LLM) は、人間の言語を理解して生成できるため、大きな注目を集めています。
さまざまな医療業務(臨床診断の強化や医学教育の提供など)のサポートにおけるLLMの採用に焦点を当てた研究の傾向が急成長している一方で、これらの取り組み、特に医学における開発、実用化、成果のレビュー、
希少なままです。
したがって、このレビューは、LLM が直面する課題と機会を含め、医療における LLM の開発と展開の詳細な概要を提供することを目的としています。
開発に関しては、基本的なモデル構造、パラメーターの数、モデル開発に使用されるデータのソースと規模など、既存の医療 LLM の原理を詳細に紹介します。
これは、専門家が特定のニーズに合わせて医療 LLM を開発する際のガイドとして役立ちます。
導入に関しては、さまざまな医療タスクにわたるさまざまな LLM のパフォーマンスを比較し、さらにそれらを最先端の軽量モデルと比較して、医療における LLM の利点と限界を理解することを目的としています。
全体として、このレビューでは次の質問に取り組みます: 1) 医療 LLM を開発するための実践方法は何ですか? 2) 医療現場で LLM の医療タスクのパフォーマンスを測定するにはどうすればよいですか?
3) 医療 LLM は実際の現場でどのように採用されていますか?
4) 医療 LLM の使用によりどのような課題が生じますか?
5) 医療 LLM をより効果的に開発および導入するにはどうすればよいですか?
これらの質問に答えることで、このレビューは医療における LLM の機会についての洞察を提供し、実践的なリソースとして機能することを目的としています。
また、医療 LLM に関する実践ガイドの定期更新リストも https://github.com/AI-in-Health/MedLLMsPracticalGuide で管理しています。

要約(オリジナル)

Large language models (LLMs), such as ChatGPT, have received substantial attention due to their capabilities for understanding and generating human language. While there has been a burgeoning trend in research focusing on the employment of LLMs in supporting different medical tasks (e.g., enhancing clinical diagnostics and providing medical education), a review of these efforts, particularly their development, practical applications, and outcomes in medicine, remains scarce. Therefore, this review aims to provide a detailed overview of the development and deployment of LLMs in medicine, including the challenges and opportunities they face. In terms of development, we provide a detailed introduction to the principles of existing medical LLMs, including their basic model structures, number of parameters, and sources and scales of data used for model development. It serves as a guide for practitioners in developing medical LLMs tailored to their specific needs. In terms of deployment, we offer a comparison of the performance of different LLMs across various medical tasks, and further compare them with state-of-the-art lightweight models, aiming to provide an understanding of the advantages and limitations of LLMs in medicine. Overall, in this review, we address the following questions: 1) What are the practices for developing medical LLMs 2) How to measure the medical task performance of LLMs in a medical setting? 3) How have medical LLMs been employed in real-world practice? 4) What challenges arise from the use of medical LLMs? and 5) How to more effectively develop and deploy medical LLMs? By answering these questions, this review aims to provide insights into the opportunities for LLMs in medicine and serve as a practical resource. We also maintain a regularly updated list of practical guides on medical LLMs at: https://github.com/AI-in-Health/MedLLMsPracticalGuide.

arxiv情報

著者 Hongjian Zhou,Fenglin Liu,Boyang Gu,Xinyu Zou,Jinfa Huang,Jinge Wu,Yiru Li,Sam S. Chen,Peilin Zhou,Junling Liu,Yining Hua,Chengfeng Mao,Chenyu You,Xian Wu,Yefeng Zheng,Lei Clifton,Zheng Li,Jiebo Luo,David A. Clifton
発行日 2024-05-15 13:38:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク