Dialogue-Contextualized Re-ranking for Medical History-Taking

要約

タイトル:医療歴史取得のための対話文脈に基づく再ランキング

要約:
– AI駆動の医療歴史取得は、症状チェック、自動患者受付、トリアージ、その他のAI仮想ケアアプリケーションにおいて重要な要素である。
– 歴史取得は非常に多様であるため、機械学習モデルは十分なデータを必要とする。
– この課題を克服するために、既存のシステムは間接的なデータや専門家の知識を使用して開発されている。
– このため、モデルは学習時とは異なる種類のデータを観察するため、学習推論ギャップが生じる。
– 本研究では、対話文脈モデルを使用して最初の段階の質問候補を再ランキングする2段階のアプローチを提案することで、学習推論ギャップを埋める。
– そのために、すべての質問に対して対話を交差エンコードする新しいモデルであるグローバル・リランカーを提案し、複数の既存のニューラルベースラインと比較する。
– トランスフォーマーとS4ベースの言語モデルバックボーンの両方をテストする。
– 専門家システムと比較して、提案されたグローバル・リランカーがトランスフォーマーバックボーンを使用する場合に最高の性能が得られ、正規化割引累積利得(nDCG)が30%、平均適合率(mAP)が77%向上した。

要約(オリジナル)

AI-driven medical history-taking is an important component in symptom checking, automated patient intake, triage, and other AI virtual care applications. As history-taking is extremely varied, machine learning models require a significant amount of data to train. To overcome this challenge, existing systems are developed using indirect data or expert knowledge. This leads to a training-inference gap as models are trained on different kinds of data than what they observe at inference time. In this work, we present a two-stage re-ranking approach that helps close the training-inference gap by re-ranking the first-stage question candidates using a dialogue-contextualized model. For this, we propose a new model, global re-ranker, which cross-encodes the dialogue with all questions simultaneously, and compare it with several existing neural baselines. We test both transformer and S4-based language model backbones. We find that relative to the expert system, the best performance is achieved by our proposed global re-ranker with a transformer backbone, resulting in a 30% higher normalized discount cumulative gain (nDCG) and a 77% higher mean average precision (mAP).

arxiv情報

著者 Jian Zhu,Ilya Valmianski,Anitha Kannan
発行日 2023-04-04 17:31:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.IR パーマリンク