Towards Causality-Aware Inferring: A Sequential Discriminative Approach for Medical Diagnosis

要約

医療診断支援システム(Medical Diagnosis Assistant: MDA)は、逐次症状を尋ねて病気を判別する対話型診断エージェントの構築を目指している。しかし、患者シミュレータを構築するために使用される対話記録は受動的に収集されるため、収集者の好みなど、タスクとは無関係なバイアスによってデータが劣化する可能性がある。このようなバイアスは、診断エージェントがシミュレータから搬送可能な知識を取得する妨げとなる可能性がある。本研究では、因果関係図を利用して、2つの代表的な非因果的バイアス、すなわち、(i)デフォルト回答バイアス、(ii)分布問い合わせバイアスを特定し、解決することにより、MDAにおけるこれらの重要な問題に対処することを試みる。具体的には、(i)のバイアスは、患者シミュレータに起因するものであり、このシミュレータは、記録されていない問い合わせに対して、いくつかのバイアスのかかったデフォルトの回答で答えようとする。その結果、診断エージェントは、偏った回答のために、その利点を十分に発揮することができない。バイアス(ii)は、受動的に収集されたデータと共に本質的に発生するものであり、エージェントを「何を記憶するか」よりも「どのように学習するか」に向けて訓練する際の重要な障害の一つである。例えば、訓練データの分布の中で、ある症状がある病気と非常に結合している場合、エージェントはその病気を識別するためにその症状についてのみ問い合わせることを学習するかもしれない。このため、我々は、症状照会と疾病診断の2つのプロセスをそれぞれ含む漸進的保証エージェントを提案する。問診プロセスは、診断プロセスによってトップダウン的に駆動され、診断の信頼性を高めるために症状を問診する。

要約(オリジナル)

Medical diagnosis assistant (MDA) aims to build an interactive diagnostic agent to sequentially inquire about symptoms for discriminating diseases. However, since the dialogue records used to build a patient simulator are collected passively, the data might be deteriorated by some task-unrelated biases, such as the preference of the collectors. These biases might hinder the diagnostic agent to capture transportable knowledge from the simulator. This work attempts to address these critical issues in MDA by taking advantage of the causal diagram to identify and resolve two representative non-causal biases, i.e., (i) default-answer bias and (ii) distributional inquiry bias. Specifically, Bias (i) originates from the patient simulator which tries to answer the unrecorded inquiries with some biased default answers. Consequently, the diagnostic agents cannot fully demonstrate their advantages due to the biased answers. To eliminate this bias and inspired by the propensity score matching technique with causal diagram, we propose a propensity-based patient simulator to effectively answer unrecorded inquiry by drawing knowledge from the other records; Bias (ii) inherently comes along with the passively collected data, and is one of the key obstacles for training the agent towards ‘learning how’ rather than ‘remembering what’. For example, within the distribution of training data, if a symptom is highly coupled with a certain disease, the agent might learn to only inquire about that symptom to discriminate that disease, thus might not generalize to the out-of-distribution cases. To this end, we propose a progressive assurance agent, which includes the dual processes accounting for symptom inquiry and disease diagnosis respectively. The inquiry process is driven by the diagnosis process in a top-down manner to inquire about symptoms for enhancing diagnostic confidence.

arxiv情報

著者 Junfan Lin,Keze Wang,Ziliang Chen,Xiaodan Liang,Liang Lin
発行日 2023-07-03 08:57:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク