Development of Hybrid ASR Systems for Low Resource Medical Domain Conversational Telephone Speech

要約

ますますつながりが増し、グローバル化が進む世界では、言語の壁が大きな課題となっています。
特に医療分野では、
病院や救急治療室では、コミュニケーションの困難や遅れが医療過誤や最適でない患者ケアにつながる可能性があります。
HYKIST プロジェクトでは、患者と医師のコミュニケーション、より具体的にはドイツ語を話す医師とアラビア語またはベトナム語を話す患者の間のコミュニケーションを検討します。
現在、医師はトリアフォン サービスに電話して、コミュニケーションを円滑にするために通訳の支援を受けることができます。
HYKIST の目標は、通常は専門的ではない二か国語通訳者を自動音声翻訳システムでサポートし、患者ケアを改善し、言語の壁を克服できるようにすることです。
この研究では、医療分野における 2 つの言語ペア、データ収集、さまざまな音響モデル アーキテクチャ、および方言によって引き起こされる困難に関する、この会話型電話音声翻訳タスクのための ASR システム開発の取り組みを紹介します。

要約(オリジナル)

Language barriers present a great challenge in our increasingly connected and global world. Especially within the medical domain, e.g. hospital or emergency room, communication difficulties and delays may lead to malpractice and non-optimal patient care. In the HYKIST project, we consider patient-physician communication, more specifically between a German-speaking physician and an Arabic- or Vietnamese-speaking patient. Currently, a doctor can call the Triaphon service to get assistance from an interpreter in order to help facilitate communication. The HYKIST goal is to support the usually non-professional bilingual interpreter with an automatic speech translation system to improve patient care and help overcome language barriers. In this work, we present our ASR system development efforts for this conversational telephone speech translation task in the medical domain for two languages pairs, data collection, various acoustic model architectures and dialect-induced difficulties.

arxiv情報

著者 Christoph Lüscher,Mohammad Zeineldeen,Zijian Yang,Tina Raissi,Peter Vieting,Khai Le-Duc,Weiyue Wang,Ralf Schlüter,Hermann Ney
発行日 2023-09-22 10:15:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク