FIND: Fine-grained Information Density Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis

要約

外部知識をLLMに統合する検索補強大規模言語モデル(Retrieval-Augmented Large Language Models: LLM)は、臨床診断を含む様々な医療領域で顕著な性能を示している。しかし、既存のRAG手法はタスクの難易度を効果的に評価して検索を決定することに苦慮しており、効率と精度のバランスという臨床的要求を満たすことができない。そこで本論文では、疾患診断シナリオにおけるRAGの信頼性を向上させる新しいフレームワークであるFIND(˶‾textbf‾˶)を提案する。FINDは、入力の情報密度に基づいて検索が必要かどうかを判断する、きめ細かい適応制御モジュールを組み込んでいる。検索プロセスを最適化し、知識フィルタリングモジュールを実装することで、FINDは検索が臨床シナリオにより適していることを保証する。中国の3つの電子カルテデータセットを用いた実験により、FINDが様々なベースライン手法を大幅に上回ることが実証され、臨床診断タスクにおける有効性が強調された。

要約(オリジナル)

Retrieval-Augmented Large Language Models (LLMs), which integrate external knowledge into LLMs, have shown remarkable performance in various medical domains, including clinical diagnosis. However, existing RAG methods struggle to effectively assess task difficulty to make retrieval decisions, thereby failing to meet the clinical requirements for balancing efficiency and accuracy. So in this paper, we propose FIND (\textbf{F}ine-grained \textbf{In}formation \textbf{D}ensity Guided Adaptive RAG), a novel framework that improves the reliability of RAG in disease diagnosis scenarios. FIND incorporates a fine-grained adaptive control module to determine whether retrieval is necessary based on the information density of the input. By optimizing the retrieval process and implementing a knowledge filtering module, FIND ensures that the retrieval is better suited to clinical scenarios. Experiments on three Chinese electronic medical record datasets demonstrate that FIND significantly outperforms various baseline methods, highlighting its effectiveness in clinical diagnosis tasks.

arxiv情報

著者 Mingyi Jia,Junwen Duan,Yan Song,Jianxin Wang
発行日 2025-04-03 09:07:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク