From Questions to Clinical Recommendations: Large Language Models Driving Evidence-Based Clinical Decision Making

要約

厳格な研究とデータ分析に由来する臨床的証拠は、情報に基づいた意思決定のための信頼できる科学的基盤を医療専門家に提供します。
臨床的証拠をリアルタイムの実践に統合することは、膨大なワークロード、複雑な専門プロセス、および時間の制約のために困難です。
これは、臨床環境でのより効率的かつ正確な意思決定をサポートするために、証拠統合を自動化するツールの必要性を強調しています。
この研究では、エビデンス統合を自動化し、標準的な臨床ガイドライン開発プロセスをモデルにした臨床的推奨事項を生成するために設計された、大規模な言語モデル(LLMS)を搭載したエビデンスに基づいた臨床決定サポートシステムを紹介します。
質問から臨床的推奨まで、すべてのフェーズをカバーする完全に自動化されたチェーンをより迅速に実装し、統合ツールとインタラクティブなユーザーインターフェイスを介してカスタマイズされた意思決定をさらに可能にします。
Quickerの機能を評価するために、3つの異なる疾患の臨床ガイドライン開発記録に基づいて、Q2CRBENCH-3ベンチマークデータセットを開発しました。
実験結果は、ユーザーの好みに合わせて調整された細かい質問分解、人間の専門家に匹敵する検索感度、および関連する研究の包括的な包含に近づく文献スクリーニングパフォーマンスで、Quickerの強力なパフォーマンスを強調しました。
さらに、より速い支援の証拠評価は、人間のレビュアーを効果的にサポートしましたが、迅速な推奨事項は臨床医よりも包括的で論理的に一貫性がありました。
システムレベルのテストでは、単一のレビュアーとのコラボレーションと、推奨開発に必要な時間が20〜40分に短縮されました。
一般に、我々の調査結果は、医師がより迅速でより信頼性の高いエビデンスに基づいた臨床決定を行うのを支援する迅速な可能性を確認しています。

要約(オリジナル)

Clinical evidence, derived from rigorous research and data analysis, provides healthcare professionals with reliable scientific foundations for informed decision-making. Integrating clinical evidence into real-time practice is challenging due to the enormous workload, complex professional processes, and time constraints. This highlights the need for tools that automate evidence synthesis to support more efficient and accurate decision making in clinical settings. This study introduces Quicker, an evidence-based clinical decision support system powered by large language models (LLMs), designed to automate evidence synthesis and generate clinical recommendations modeled after standard clinical guideline development processes. Quicker implements a fully automated chain that covers all phases, from questions to clinical recommendations, and further enables customized decision-making through integrated tools and interactive user interfaces. To evaluate Quicker’s capabilities, we developed the Q2CRBench-3 benchmark dataset, based on clinical guideline development records for three different diseases. Experimental results highlighted Quicker’s strong performance, with fine-grained question decomposition tailored to user preferences, retrieval sensitivities comparable to human experts, and literature screening performance approaching comprehensive inclusion of relevant studies. In addition, Quicker-assisted evidence assessment effectively supported human reviewers, while Quicker’s recommendations were more comprehensive and logically coherent than those of clinicians. In system-level testing, collaboration between a single reviewer and Quicker reduced the time required for recommendation development to 20-40 minutes. In general, our findings affirm the potential of Quicker to help physicians make quicker and more reliable evidence-based clinical decisions.

arxiv情報

著者 Dubai Li,Nan Jiang,Kangping Huang,Ruiqi Tu,Shuyu Ouyang,Huayu Yu,Lin Qiao,Chen Yu,Tianshu Zhou,Danyang Tong,Qian Wang,Mengtao Li,Xiaofeng Zeng,Yu Tian,Xinping Tian,Jingsong Li
発行日 2025-05-15 13:30:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク