要約
オンライン医療相談 (OMC) では、医師は問診を通じてのみ患者情報を収集することが制限されており、ただでさえ複雑な診断の一連の意思決定プロセスがさらに困難になっています。
最近、大規模言語モデルの急速な進歩により、OMC を変革する大きな可能性が実証されました。
しかし、ほとんどの研究は、比較的十分な情報が得られる状況下での診断精度の向上に主に焦点を当てており、相談プロセスの「調査」段階には限定的な注意を払っています。
この焦点の欠如により、「問診」と「診断」の関係は十分に検討されていません。
この論文では、最初に本物の医師と患者の会話から実際の患者の対話戦略を抽出し、これらの戦略を使用して、現実世界の行動を厳密に反映する患者シミュレーターのトレーニングをガイドします。
患者シミュレーターにカルテを入力し、患者様の反応をシミュレーションすることで、診察における「問診」と「診断」の関係を探る実験を徹底的に行っています。
実験結果は、問診と診断がリービッヒの法則に従うことを示しています。つまり、問診の質が低いと、診断能力に関係なく診断の有効性が制限され、またその逆も同様です。
さらに、実験により、さまざまなモデルの照会パフォーマンスに大きな違いがあることが明らかになりました。
この現象を調査するために、問い合わせプロセスを次の 4 つのタイプに分類します。(1) 主訴の問い合わせ。
(2) 既知の症状の特定。
(3)随伴症状についての問診。
(4) 家族歴または病歴を収集する。
さまざまなモデルの 4 つのタイプにわたる問い合わせの分布を分析し、パフォーマンスの大きな違いの背後にある理由を調査します。
患者シミュレーターの重みと関連コードを https://github.com/LIO-H-ZEN/PatientSimulator でオープンソース化する予定です。
要約(オリジナル)
Online medical consultation (OMC) restricts doctors to gathering patient information solely through inquiries, making the already complex sequential decision-making process of diagnosis even more challenging. Recently, the rapid advancement of large language models has demonstrated a significant potential to transform OMC. However, most studies have primarily focused on improving diagnostic accuracy under conditions of relatively sufficient information, while paying limited attention to the ‘inquiry’ phase of the consultation process. This lack of focus has left the relationship between ‘inquiry’ and ‘diagnosis’ insufficiently explored. In this paper, we first extract real patient interaction strategies from authentic doctor-patient conversations and use these strategies to guide the training of a patient simulator that closely mirrors real-world behavior. By inputting medical records into our patient simulator to simulate patient responses, we conduct extensive experiments to explore the relationship between ‘inquiry’ and ‘diagnosis’ in the consultation process. Experimental results demonstrate that inquiry and diagnosis adhere to the Liebig’s law: poor inquiry quality limits the effectiveness of diagnosis, regardless of diagnostic capability, and vice versa. Furthermore, the experiments reveal significant differences in the inquiry performance of various models. To investigate this phenomenon, we categorize the inquiry process into four types: (1) chief complaint inquiry; (2) specification of known symptoms; (3) inquiry about accompanying symptoms; and (4) gathering family or medical history. We analyze the distribution of inquiries across the four types for different models to explore the reasons behind their significant performance differences. We plan to open-source the weights and related code of our patient simulator at https://github.com/LIO-H-ZEN/PatientSimulator.
arxiv情報
著者 | Zhaocheng Liu,Quan Tu,Wen Ye,Yu Xiao,Zhishou Zhang,Hengfu Cui,Yalun Zhu,Qiang Ju,Shizheng Li,Jian Xie |
発行日 | 2025-01-16 11:41:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google