Improving Clinical Note Generation from Complex Doctor-Patient Conversation

要約

臨床メモを書いて、健康診断の文書化は、医療専門家にとって重要なタスクであり、患者ケアの文書の重要な要素として機能します。
ただし、これらのメモを手動で書くことは時間がかかり、臨床医が直接的な患者の相互作用やその他のタスクに費やすことができる時間に影響を与える可能性があります。
その結果、自動化された臨床ノート生成システムの開発は、健康のためのAI内の臨床的に意味のある研究分野として浮上しています。
この論文では、大規模な言語モデル(LLMS)を使用して、臨床ノート生成の分野に3つの重要な貢献をします。
まず、Cliniknoteを紹介します。Cliniknoteは、完全な臨床ノートと組み合わせた1,200の複雑な医師と患者の会話で構成される包括的なデータセットです。
現代のニューラルネットワークの助けを借りて医療専門家によって作成およびキュレーションされたこのデータセットは、臨床ノート生成タスクでモデルをトレーニングおよび評価するための貴重なリソースを提供します。
第二に、従来の石鹸〜\ cite {podder2023soap}(主観的、客観的、評価、計画)のメモを上部に追加して、本質的な情報をすばやく識別できるようにするk-soap(キーワード、主観的、客観的、評価、および計画)のノート形式を提案します。
第三に、自動パイプラインを開発して、医師と患者の会話からK-SOAPノートを生成し、さまざまなメトリックを使用してさまざまな最新のLLMをベンチマークします。
我々の結果は、標準のLLM Finetuningメソッドと比較して、効率とパフォーマンスの大幅な改善を示しています。

要約(オリジナル)

Writing clinical notes and documenting medical exams is a critical task for healthcare professionals, serving as a vital component of patient care documentation. However, manually writing these notes is time-consuming and can impact the amount of time clinicians can spend on direct patient interaction and other tasks. Consequently, the development of automated clinical note generation systems has emerged as a clinically meaningful area of research within AI for health. In this paper, we present three key contributions to the field of clinical note generation using large language models (LLMs). First, we introduce CliniKnote, a comprehensive dataset consisting of 1,200 complex doctor-patient conversations paired with their full clinical notes. This dataset, created and curated by medical experts with the help of modern neural networks, provides a valuable resource for training and evaluating models in clinical note generation tasks. Second, we propose the K-SOAP (Keyword, Subjective, Objective, Assessment, and Plan) note format, which enhances traditional SOAP~\cite{podder2023soap} (Subjective, Objective, Assessment, and Plan) notes by adding a keyword section at the top, allowing for quick identification of essential information. Third, we develop an automatic pipeline to generate K-SOAP notes from doctor-patient conversations and benchmark various modern LLMs using various metrics. Our results demonstrate significant improvements in efficiency and performance compared to standard LLM finetuning methods.

arxiv情報

著者 Yizhan Li,Sifan Wu,Christopher Smith,Thomas Lo,Bang Liu
発行日 2025-06-16 16:24:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク