Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents


最近の大規模言語モデル (LLM) の急速な発展は、医療用人工知能 (AI) における技術革命の新たな波を引き起こしました。
LLM は人間のようにテキストを理解して生成するように設計されていますが、LLM を「脳」として利用する自律エージェントは、「身体」が環境と対話できるようにすることで、計画、反映、ツールの使用など、テキスト処理を超えた機能を発揮します。
私たちは、病気の治療プロセス全体をシミュレートするエージェント病院と呼ばれる病院のシミュラクラムを導入します。この病院では、すべての患者、看護師、医師が LLM を利用した自律エージェントです。
シミュラクル内では、医師エージェントはトレーニング データに手動でラベルを付ける必要なく、多数の患者エージェントを治療することで進化できます。
シミュレーションで数万人の患者エージェントを治療した後 (人間の医師は現実世界では数年かかる場合があります)、進化したドクター エージェントは、米国医師免許試験 (USMLE) を構成する MedQA ベンチマークで最先端の医療エージェント手法を上回りました。
私たちのシミュラークル構築とエージェント進化の手法は、医療 AI を超えて幅広いアプリケーションに利益をもたらす可能性を秘めています。


The recent rapid development of large language models (LLMs) has sparked a new wave of technological revolution in medical artificial intelligence (AI). While LLMs are designed to understand and generate text like a human, autonomous agents that utilize LLMs as their ‘brain’ have exhibited capabilities beyond text processing such as planning, reflection, and using tools by enabling their ‘bodies’ to interact with the environment. We introduce a simulacrum of hospital called Agent Hospital that simulates the entire process of treating illness, in which all patients, nurses, and doctors are LLM-powered autonomous agents. Within the simulacrum, doctor agents are able to evolve by treating a large number of patient agents without the need to label training data manually. After treating tens of thousands of patient agents in the simulacrum (human doctors may take several years in the real world), the evolved doctor agents outperform state-of-the-art medical agent methods on the MedQA benchmark comprising US Medical Licensing Examination (USMLE) test questions. Our methods of simulacrum construction and agent evolution have the potential in benefiting a broad range of applications beyond medical AI.


著者 Junkai Li,Yunghwei Lai,Weitao Li,Jingyi Ren,Meng Zhang,Xinhui Kang,Siyu Wang,Peng Li,Ya-Qin Zhang,Weizhi Ma,Yang Liu
発行日 2025-01-17 11:59:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI パーマリンク