要約
ブローカ失語症は、比較的理解力はあるものの、流暢でなく、努力的で断片的な発話を特徴とする失語症の一種です。
従来の失語症の治療法は多くの場合、時間と労力がかかり、現実世界の会話を反映していないため、大規模言語モデル (LLM) などの自然言語処理ベースのアプローチを適用することで、既存の治療アプローチの改善に貢献できる可能性があります。
この問題に対処するために、断片化されたブローカ失語症の文章を完成させるためのシーケンスツーシーケンス LLM の使用を検討します。
まず、ブローカ失語症音声の言語的特徴を反映するように設計されたルールベースのシステムを使用して、合成ブローカ失語症データを生成します。
この合成データを使用して、断片化された文を完成させるというタスクに関して、事前にトレーニングされた 4 つの LLM を微調整します。
私たちは、合成および本物の Broca 失語症データの両方に基づいて微調整されたモデルを評価します。
断片化された文を再構築する LLM の機能を実証し、モデルは入力発話が長くなるとパフォーマンスが向上することを示します。
我々の結果は、ブローカ失語症患者やおそらく他の臨床集団に対するコミュニケーション支援を進歩させるLLMの可能性を浮き彫りにしている。
要約(オリジナル)
Broca’s aphasia is a type of aphasia characterized by non-fluent, effortful and fragmented speech production with relatively good comprehension. Since traditional aphasia treatment methods are often time-consuming, labour-intensive, and do not reflect real-world conversations, applying natural language processing based approaches such as Large Language Models (LLMs) could potentially contribute to improving existing treatment approaches. To address this issue, we explore the use of sequence-to-sequence LLMs for completing fragmented Broca’s aphasic sentences. We first generate synthetic Broca’s aphasic data using a rule-based system designed to mirror the linguistic characteristics of Broca’s aphasic speech. Using this synthetic data, we then fine-tune four pre-trained LLMs on the task of completing fragmented sentences. We evaluate our fine-tuned models on both synthetic and authentic Broca’s aphasic data. We demonstrate LLMs’ capability for reconstructing fragmented sentences, with the models showing improved performance with longer input utterances. Our result highlights the LLMs’ potential in advancing communication aids for individuals with Broca’s aphasia and possibly other clinical populations.
arxiv情報
著者 | Sijbren van Vaals,Yevgen Matusevych,Frank Tsiwah |
発行日 | 2024-12-23 15:54:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google