Terminology-aware Medical Dialogue Generation

要約

医療対話生成は、医師と患者の間の対話ターンの履歴に従って応答を生成することを目的としています。
オープンドメインの対話生成とは異なり、これには医療分野に固有の背景知識が必要です。
医療対話生成のための既存の生成フレームワークは、特に医療用語に関して、ドメイン固有の知識を組み込むには不十分です。
この論文では、ドメイン固有の用語を中心とした機能を考慮することにより、医療対話の生成を改善するための新しいフレームワークを提案します。
アテンション メカニズムを活用して用語中心の機能を組み込み、言語モデルに補助的な用語認識タスクを使用して用語表現を学習させることで、医学的背景知識と一般的な発話との間のセマンティック ギャップを埋めます。
実験結果は、提案されたフレームワークが SOTA 言語モデルよりも優れているアプローチの有効性を示しています。
さらに、医療対話生成に関する研究をサポートするために、医療用語の注釈を含む新しいデータセットを提供します。
データセットとコードは https://github.com/tangg555/meddialog で入手できます。

要約(オリジナル)

Medical dialogue generation aims to generate responses according to a history of dialogue turns between doctors and patients. Unlike open-domain dialogue generation, this requires background knowledge specific to the medical domain. Existing generative frameworks for medical dialogue generation fall short of incorporating domain-specific knowledge, especially with regard to medical terminology. In this paper, we propose a novel framework to improve medical dialogue generation by considering features centered on domain-specific terminology. We leverage an attention mechanism to incorporate terminologically centred features, and fill in the semantic gap between medical background knowledge and common utterances by enforcing language models to learn terminology representations with an auxiliary terminology recognition task. Experimental results demonstrate the effectiveness of our approach, in which our proposed framework outperforms SOTA language models. Additionally, we provide a new dataset with medical terminology annotations to support the research on medical dialogue generation. Our dataset and code are available at https://github.com/tangg555/meddialog.

arxiv情報

著者 Chen Tang,Hongbo Zhang,Tyler Loakman,Chenghua Lin,Frank Guerin
発行日 2023-03-15 00:02:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク