NoteChat: A Dataset of Synthetic Doctor-Patient Conversations Conditioned on Clinical Notes

要約

私たちは、大規模言語モデル (LLM) を活用して患者と医師の対話を生成する新しい協調的なマルチエージェント フレームワークである NoteChat を紹介します。
NoteChat は、役割固有の LLM のアンサンブルが、構造化されたロールプレイと戦略的プロンプトを通じて、割り当てられた役割をより効果的に実行できるという原則を具体化しています。
これらのロールプレイング LLM 間の相乗効果により、一貫性のある効率的な対話が生成されます。
患者と医師の対話とノートのペアのベンチマーク データセットである MTS ダイアログの評価では、NoteChat による拡張合成患者と医師の対話でトレーニングされたモデルが、臨床ノートの生成において他の最先端のモデルよりも優れていることが示されています。
当社の包括的な自動および人間による評価では、臨床メモに基づいて優れた合成の患者と医師の対話を生成する点で、分野の専門家によって NoteChat が ChatGPT や GPT-4 などの最先端のモデルを最大 22.78% 大幅に上回っていることが実証されています。
NoteChat には、患者と直接関わり、医師の燃え尽き症候群の主な原因である臨床文書の作成に役立つ可能性があります。

要約(オリジナル)

We introduce NoteChat, a novel cooperative multi-agent framework leveraging Large Language Models (LLMs) to generate patient-physician dialogues. NoteChat embodies the principle that an ensemble of role-specific LLMs, through structured role-play and strategic prompting, can perform their assigned roles more effectively. The synergy among these role-playing LLMs results in a cohesive and efficient dialogue generation. Evaluation on MTS-dialogue, a benchmark dataset for patient-physician dialogues-note pairs, shows that models trained with the augmented synthetic patient-physician dialogues by NoteChat outperforms other state-of-the-art models for generating clinical notes. Our comprehensive automatic and human evaluation demonstrates that NoteChat substantially surpasses state-of-the-art models like ChatGPT and GPT-4 up to 22.78% by domain experts in generating superior synthetic patient-physician dialogues based on clinical notes. NoteChat has the potential to engage patients directly and help clinical documentation, a leading cause of physician burnout.

arxiv情報

著者 Junda Wang,Zonghai Yao,Zhichao Yang,Huixue Zhou,Rumeng Li,Xun Wang,Yucheng Xu,Hong Yu
発行日 2024-06-28 13:28:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク