要約
大規模言語モデル (LLM) の開発は、人工知能 (AI) ベースの医療診断に前例のない可能性をもたらしました。
ただし、LLM は患者データを積極的に収集することに熟達していないため、実際の診断シナリオにおける LLM の適用の観点はまだ不明瞭です。
この研究では、医師をエミュレートすることで計画能力を強化する LLM ベースの診断システムを紹介します。
当社のシステムでは、2 人の外部プランナーが計画タスクを処理します。
最初のプランナーは、強化学習アプローチを採用して疾患スクリーニングの質問を作成し、初期診断を実施します。
2 番目のプランナーは、LLM を使用して医療ガイドラインを解析し、鑑別診断を実施します。
実際の患者の電子カルテデータを活用し、仮想患者と医師との模擬対話を構築し、システムの診断能力を評価しました。
私たちのシステムは、疾患スクリーニングと鑑別診断の両方において、GPT-4 Turboを含む既存のモデルを大幅に上回っていることを実証します。
この研究は、AI を臨床現場にさらにシームレスに統合するための一歩を表し、医療診断の精度とアクセシビリティを向上させる可能性があります。
要約(オリジナル)
The development of large language models (LLMs) has brought unprecedented possibilities for artificial intelligence (AI) based medical diagnosis. However, the application perspective of LLMs in real diagnostic scenarios is still unclear because they are not adept at collecting patient data proactively. This study presents a LLM-based diagnostic system that enhances planning capabilities by emulating doctors. Our system involves two external planners to handle planning tasks. The first planner employs a reinforcement learning approach to formulate disease screening questions and conduct initial diagnoses. The second planner uses LLMs to parse medical guidelines and conduct differential diagnoses. By utilizing real patient electronic medical record data, we constructed simulated dialogues between virtual patients and doctors and evaluated the diagnostic abilities of our system. We demonstrate that our system significantly surpasses existing models, including GPT-4 Turbo, in both disease screening and differential diagnoses. This research represents a step towards more seamlessly integrating AI into clinical settings, potentially enhancing the accuracy and accessibility of medical diagnostics.
arxiv情報
著者 | Zhoujian Sun,Cheng Luo,Ziyi Liu,Zhengxing Huang |
発行日 | 2024-05-13 11:58:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google