MEDDxAgent: A Unified Modular Agent Framework for Explainable Automatic Differential Diagnosis

要約

鑑別診断(DDX)は、臨床的意思決定の基本的でありながら複雑な側面であり、医師は症状、前件、および医学知識に基づいて、可能な病気のランク付けされたリストを反復的に改良します。
大規模な言語モデルの最近の進歩はDDXのサポートに有望であることが示されていますが、既存のアプローチは、単一データセットの評価、コンポーネントの孤立した最適化、完全な患者プロファイルに関する非現実的な仮定、および単一の診断などの重要な制限に直面しています。
完全な患者プロファイルにアクセスできると仮定するのではなく、診断推論が反復学習を通じて進化するインタラクティブDDX向けに設計されたモジュラー説明可能なDDXエージェント(MEDDXAGENT)フレームワークを導入します。
MedDxagentは、3つのモジュラーコンポーネントを統合します。(1)オーケストレーター(DDXDriver)、(2)シミュレーターを採用する履歴、および(3)知識の検索および診断戦略のための2つの専門的なエージェント。
堅牢な評価を確保するために、呼吸、皮膚、希少疾患をカバーする包括的なDDXベンチマークを導入します。
単一ターンの診断アプローチを分析し、最初に患者プロファイルが利用できない場合の反復改良の重要性を実証します。
当社の幅広い評価は、MedDxagentが大小のLLMと小さなLLMの両方でインタラクティブDDXの10%以上の精度の向上を達成し、その診断推論プロセスに重要な説明可能性を提供することを示しています。

要約(オリジナル)

Differential Diagnosis (DDx) is a fundamental yet complex aspect of clinical decision-making, in which physicians iteratively refine a ranked list of possible diseases based on symptoms, antecedents, and medical knowledge. While recent advances in large language models have shown promise in supporting DDx, existing approaches face key limitations, including single-dataset evaluations, isolated optimization of components, unrealistic assumptions about complete patient profiles, and single-attempt diagnosis. We introduce a Modular Explainable DDx Agent (MEDDxAgent) framework designed for interactive DDx, where diagnostic reasoning evolves through iterative learning, rather than assuming a complete patient profile is accessible. MEDDxAgent integrates three modular components: (1) an orchestrator (DDxDriver), (2) a history taking simulator, and (3) two specialized agents for knowledge retrieval and diagnosis strategy. To ensure robust evaluation, we introduce a comprehensive DDx benchmark covering respiratory, skin, and rare diseases. We analyze single-turn diagnostic approaches and demonstrate the importance of iterative refinement when patient profiles are not available at the outset. Our broad evaluation demonstrates that MEDDxAgent achieves over 10% accuracy improvements in interactive DDx across both large and small LLMs, while offering critical explainability into its diagnostic reasoning process.

arxiv情報

著者 Daniel Rose,Chia-Chien Hung,Marco Lepri,Israa Alqassem,Kiril Gashteovski,Carolin Lawrence
発行日 2025-02-26 14:31:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク