Expertise Is What We Want

要約

臨床的意思決定は、標準化された証拠に基づいたガイドラインによって導かれる専門家の推論に依存します。
ただし、これらのガイドラインを自動化された臨床意思決定支援システムに変換すると、不正確さと重要なことには、ニュアンスの喪失が危険にさらされます。
大規模な言語モデル(LLM)の柔軟性とパワーを、専門家システムの解釈可能性、説明可能性、信頼性を組み合わせたアプリケーションアーキテクチャである大規模な言語エキスパート(LLE)を共有します。
LLMSは、知識の統合や成文化など、専門家システムの重要な課題に対処するのに役立ちます。
逆に、専門家のシステムのようなアプローチは、幻覚、原子的および安価な更新、テスト可能性など、LLMの課題を克服するのに役立ちます。
大規模な言語専門家(LLE)システムの力を強調するために、癌と新たに診断された患者の精密検査を支援するためにLLEを構築しました。
癌治療のタイムリーな開始は、最適な患者の転帰にとって重要です。
しかし、診断の推奨事項の複雑さを高めることで、プライマリケアの医師が腫瘍医との最初の訪問の前に患者が必要な精密検査を完了するようにすることが困難になりました。
多くの現実世界の臨床タスクと同様に、これらの精密検査では、構造化されていない健康記録の分析と微妙な臨床決定ロジックの適用が必要です。
この研究では、正しい診断の精密検査を迅速に特定し、提案するように構築されたLLEシステムの設計と評価について説明します。
このシステムは、高度な臨床レベルの精度(> 95%)を実証し、大きな学術センターの乳がん患者と結腸癌患者の実際のデータで特定されたギャップに効果的に対処しました。

要約(オリジナル)

Clinical decision-making depends on expert reasoning, which is guided by standardized, evidence-based guidelines. However, translating these guidelines into automated clinical decision support systems risks inaccuracy and importantly, loss of nuance. We share an application architecture, the Large Language Expert (LLE), that combines the flexibility and power of Large Language Models (LLMs) with the interpretability, explainability, and reliability of Expert Systems. LLMs help address key challenges of Expert Systems, such as integrating and codifying knowledge, and data normalization. Conversely, an Expert System-like approach helps overcome challenges with LLMs, including hallucinations, atomic and inexpensive updates, and testability. To highlight the power of the Large Language Expert (LLE) system, we built an LLE to assist with the workup of patients newly diagnosed with cancer. Timely initiation of cancer treatment is critical for optimal patient outcomes. However, increasing complexity in diagnostic recommendations has made it difficult for primary care physicians to ensure their patients have completed the necessary workup before their first visit with an oncologist. As with many real-world clinical tasks, these workups require the analysis of unstructured health records and the application of nuanced clinical decision logic. In this study, we describe the design & evaluation of an LLE system built to rapidly identify and suggest the correct diagnostic workup. The system demonstrated a high degree of clinical-level accuracy (>95%) and effectively addressed gaps identified in real-world data from breast and colon cancer patients at a large academic center.

arxiv情報

著者 Alan Ashworth,Munir Al-Dajani,Keegan Duchicela,Kiril Kafadarov,Allison Kurian,Othman Laraki,Amina Lazrak,Divneet Mandair,Wendy McKennon,Rebecca Miksad,Jayodita Sanghvi,Travis Zack
発行日 2025-02-27 18:05:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, I.2.7 パーマリンク