Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings



– 医療現場での自動音声認識(ASR)は、時間短縮、コスト削減、報告書の正確性向上、医師のバーンアウトの軽減などのメリットがある。
– しかし、ASR技術を採用する際には、医学的に深刻なミスを避けることが重要であり、そのため、医療業界はASR技術の導入には慎重な姿勢を取っている。
– 本研究では、クリニカルBERTScore(CBERTScore)というASRメトリックを提案し、医学的に重要なミスを他のミスよりも厳しく罰則化することで、医師の嗜好により合致するASRメトリックであることを示す。
– 149の現実的な医学文に18人の医師の嗜好を集め、CBERTScoreが医師の嗜好に合致することを示し、クリニックトランスクリプト嗜好ベンチマーク(CTP)をリリースし、医学に関するASRメトリックをさらに開発できるコミュニティに提供する。


Automatic Speech Recognition (ASR) in medical contexts has the potential to save time, cut costs, increase report accuracy, and reduce physician burnout. However, the healthcare industry has been slower to adopt this technology, in part due to the importance of avoiding medically-relevant transcription mistakes. In this work, we present the Clinical BERTScore (CBERTScore), an ASR metric that penalizes clinically-relevant mistakes more than others. We demonstrate that this metric more closely aligns with clinician preferences on medical sentences as compared to other metrics (WER, BLUE, METEOR, etc), sometimes by wide margins. We collect a benchmark of 18 clinician preferences on 149 realistic medical sentences called the Clinician Transcript Preference benchmark (CTP), demonstrate that CBERTScore more closely matches what clinicians prefer, and release the benchmark for the community to further develop clinically-aware ASR metrics.


著者 Joel Shor,Ruyue Agnes Bi,Subhashini Venugopalan,Steven Ibara,Roman Goldenberg,Ehud Rivlin
発行日 2023-04-06 19:02:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS パーマリンク