Language Agents for Hypothesis-driven Clinical Decision Making with Reinforcement Learning

要約

臨床的意思決定は、診断と治療のために新たに発見された情報を実行し、検討するための臨床作用を繰り返し決定しなければならない動的でインタラクティブな循環的なプロセスです。
大規模な言語モデル(LLM)には、このプロセスで臨床医をサポートする可能性がありますが、臨床意思決定支援におけるLLMのほとんどのアプリケーションは、2つの制限のいずれかに苦しんでいます。
これとは対照的に、関連するテストを繰り返し要求および解釈することで診断に収束する仮説主導型の不確実性言語エージェントであるLA-CDMとの診断のための臨床的意思決定をモデル化することを提案します。
監視と強化学習を組み合わせたハイブリッドトレーニングパラダイムを使用して、臨床的意思決定の重要な側面を対象とした3つの目的でLA-CDMをトレーニングします:正確な仮説生成、仮説の不確実性推定、効率的な意思決定。
さまざまな臨床検査を含む4つの腹部疾患をカバーする実際のデータセットであるMimic-CDMの方法論を評価し、診断のパフォーマンスと効率を高めるための臨床的意思決定を明示的にトレーニングする利点を示しています。

要約(オリジナル)

Clinical decision-making is a dynamic, interactive, and cyclic process where doctors have to repeatedly decide on which clinical action to perform and consider newly uncovered information for diagnosis and treatment. Large Language Models (LLMs) have the potential to support clinicians in this process, however, most applications of LLMs in clinical decision support suffer from one of two limitations: Either they assume the unrealistic scenario of immediate availability of all patient information and do not model the interactive and iterative investigation process, or they restrict themselves to the limited ‘out-of-the-box’ capabilities of large pre-trained models without performing task-specific training. In contrast to this, we propose to model clinical decision-making for diagnosis with a hypothesis-driven uncertainty-aware language agent, LA-CDM, that converges towards a diagnosis via repeatedly requesting and interpreting relevant tests. Using a hybrid training paradigm combining supervised and reinforcement learning, we train LA-CDM with three objectives targeting critical aspects of clinical decision-making: accurate hypothesis generation, hypothesis uncertainty estimation, and efficient decision-making. We evaluate our methodology on MIMIC-CDM, a real-world dataset covering four abdominal diseases containing various clinical tests and show the benefit of explicitly training clinical decision-making for increasing diagnostic performance and efficiency.

arxiv情報

著者 David Bani-Harouni,Chantal Pellegrini,Ege Özsoy,Matthias Keicher,Nassir Navab
発行日 2025-06-16 13:32:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク