Real-time Speech Summarization for Medical Conversations

要約

医師と患者の会話では、医療に関連する情報を特定することが重要であり、会話要約の必要性が生じている。このシステムでは、会話中のN個の発話ごとにローカル要約を生成し、会話終了後にグローバル要約を生成する。このシステムは、技術的な観点から計算コストを削減すると同時に、ビジネス的な観点からユーザーエクスペリエンスを向上させることができる。第二に、我々はVietMed-Sumを発表する。VietMed-Sumは我々の知る限り、初の医療会話用の音声要約データセットである。第三に、LLMと人間のアノテーターを共同で利用し、医療会話要約のためのゴールドスタンダードと合成要約を作成した最初の例である。最後に、VietMed-Sumにおける最新モデルのベースライン結果を示す。全てのコード、データ(英語訳とベトナム語訳)、モデルはオンラインで入手可能: https://github.com/leduckhai/MultiMed/tree/master/VietMed-Sum

要約(オリジナル)

In doctor-patient conversations, identifying medically relevant information is crucial, posing the need for conversation summarization. In this work, we propose the first deployable real-time speech summarization system for real-world applications in industry, which generates a local summary after every N speech utterances within a conversation and a global summary after the end of a conversation. Our system could enhance user experience from a business standpoint, while also reducing computational costs from a technical perspective. Secondly, we present VietMed-Sum which, to our knowledge, is the first speech summarization dataset for medical conversations. Thirdly, we are the first to utilize LLM and human annotators collaboratively to create gold standard and synthetic summaries for medical conversation summarization. Finally, we present baseline results of state-of-the-art models on VietMed-Sum. All code, data (English-translated and Vietnamese) and models are available online: https://github.com/leduckhai/MultiMed/tree/master/VietMed-Sum

arxiv情報

著者 Khai Le-Duc,Khai-Nguyen Nguyen,Long Vo-Dang,Truong-Son Hy
発行日 2025-04-04 14:12:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS パーマリンク