要約
このペーパーでは、タスク A とタスク C の MEDIQA-Chat 2023 共有タスクへの UMASS_BioNLP チームの参加について説明します。
私たちは特に Task-C に焦点を当て、高品質な会話データセットを生成するための医師患者ループと呼ばれる新しい LLM 連携システムを提案します。
実験結果は、ROUGE、医療概念想起、BLEU、Self-BLEU などの自動指標によって評価されるように、私たちのアプローチが妥当なパフォーマンスをもたらすことを示しています。
さらに、提案手法とChatGPTおよびGPT-4との比較解析を行った。
この分析では、連携 LLM を利用して高品質のデータセットを生成する可能性も調査します。
要約(オリジナル)
This paper presents UMASS_BioNLP team participation in the MEDIQA-Chat 2023 shared task for Task-A and Task-C. We focus especially on Task-C and propose a novel LLMs cooperation system named a doctor-patient loop to generate high-quality conversation data sets. The experiment results demonstrate that our approaches yield reasonable performance as evaluated by automatic metrics such as ROUGE, medical concept recall, BLEU, and Self-BLEU. Furthermore, we conducted a comparative analysis between our proposed method and ChatGPT and GPT-4. This analysis also investigates the potential of utilizing cooperation LLMs to generate high-quality datasets.
arxiv情報
著者 | Junda Wang,Zonghai Yao,Avijit Mitra,Samuel Osebe,Zhichao Yang,Hong Yu |
発行日 | 2023-06-29 13:30:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google