Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support

要約

大規模な言語モデル(LLM)、特に推論能力を持つものは、近年急速に進歩しており、幅広いアプリケーションにわたって重大な可能性を示しています。
しかし、特に病気の推論タスクにおけるヘルスケアでの彼らの展開は、専門家レベルの認知データを取得するという課題によって妨げられています。
この論文では、医療専門家の認知プロセスをエミュレートすることにより、臨床の専門知識とAI推論のギャップを埋める医療言語モデルであるCitrusを紹介します。
このモデルは、臨床医の意思決定経路を正確にキャプチャする新しいアプローチを使用して合成された、シミュレートされた専門家疾患推論データの大規模なコーパスで訓練されています。
このアプローチにより、柑橘類は病状の診断と治療に関与する複雑な推論プロセスをよりよくシミュレートすることができます。
医療推論タスクのために公開されているデータセットの不足をさらに説明するために、カスタムビルドされた医療診断対話データセットを含む最終段階のトレーニングデータをリリースします。
このオープンソースの貢献は、この分野でのさらなる研究開発をサポートすることを目的としています。
MEDQAなどの権威あるベンチマークを使用した評価は、医療推論と言語理解のタスクをカバーすることで、柑橘類が同様のサイズの他のモデルと比較して優れたパフォーマンスを達成することを示しています。
これらの結果は、医療意思決定支援システムを大幅に強化する柑橘類の可能性を強調し、臨床的意思決定のためのより正確で効率的なツールを提供します。

要約(オリジナル)

Large language models (LLMs), particularly those with reasoning capabilities, have rapidly advanced in recent years, demonstrating significant potential across a wide range of applications. However, their deployment in healthcare, especially in disease reasoning tasks, is hindered by the challenge of acquiring expert-level cognitive data. In this paper, we introduce Citrus, a medical language model that bridges the gap between clinical expertise and AI reasoning by emulating the cognitive processes of medical experts. The model is trained on a large corpus of simulated expert disease reasoning data, synthesized using a novel approach that accurately captures the decision-making pathways of clinicians. This approach enables Citrus to better simulate the complex reasoning processes involved in diagnosing and treating medical conditions. To further address the lack of publicly available datasets for medical reasoning tasks, we release the last-stage training data, including a custom-built medical diagnostic dialogue dataset. This open-source contribution aims to support further research and development in the field. Evaluations using authoritative benchmarks such as MedQA, covering tasks in medical reasoning and language understanding, show that Citrus achieves superior performance compared to other models of similar size. These results highlight Citrus potential to significantly enhance medical decision support systems, providing a more accurate and efficient tool for clinical decision-making.

arxiv情報

著者 Guoxin Wang,Minyu Gao,Shuai Yang,Ya Zhang,Lizhi He,Liang Huang,Hanlin Xiao,Yexuan Zhang,Wanyue Li,Lu Chen,Jintao Fei,Xin Li
発行日 2025-02-26 02:50:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク