Automatically measuring speech fluency in people with aphasia: first achievements using read-speech data

要約

背景: 言語聴覚士 (SLP) は、失語症患者の診断やモニタリングにおいて、言語の流暢さの判断に頼ることがよくあります。
しかし、そのような主観的な方法は、信頼性の欠如と時間の観点からの臨床コストの点で批判されています。
目的: この研究は、当初は言語習得の分野で開発された、失語症 (PWA) 患者の言語流暢性の自動測定に対する信号処理アルゴリズムの関連性を評価することを目的としています。
方法と手順: 29 人の PWA と 5 人の対照参加者が、非営利団体と SLP ネットワークを通じて募集されました。
参加者全員が、フランス語版のボストン失語症診断検査から抜粋した一連の文章を声に出して読み上げている様子が記録されました。
訓練を受けた 3 人の SLP が、各文の流暢さを 5 段階の質的スケールで評価しました。
前後方向発散セグメンテーションとクラスタリング アルゴリズムを使用して、文ごとに音声流暢性の 4 つの自動予測子 (擬似音節率、音声比率、無音休憩率、擬似音節長の標準偏差) を計算しました。
4 つの予測子は最終的に多変量回帰モデル (多重線形回帰 – MLR、および 2 つの非線形モデル) に結合され、1 話者抜き検証スキームを使用して、発話流暢さの平均 SLP 評価を予測しました。
結果と結果: すべてのモデルは、平均二乗平均平方根誤差が 0.5 という低さで、発話流暢性評価の正確な予測を達成しました。
MLR により、文レベルでの参照評価との相関係数は 0.87 となり、各参加者のデータを集計すると 0.93 の相関係数が得られました。
繰り返しに敏感な追加の予測子を含めることで、予測はさらに改善され、相関係数は文レベルで 0.91、参加者レベルで 0.96 となりました。
結論: この研究で使用されたアルゴリズムは、失語症患者の読み上げ課題における言語流暢性を評価するための、費用対効果が高く信頼性の高いツールを構成することができます。
自発的発話の評価の観点について議論します。

要約(オリジナル)

Background: Speech and language pathologists (SLPs) often relyon judgements of speech fluency for diagnosing or monitoringpatients with aphasia. However, such subjective methods havebeen criticised for their lack of reliability and their clinical cost interms of time. Aims: This study aims at assessing the relevance of a signalprocessingalgorithm, initially developed in the field of language acquisition, for the automatic measurement of speech fluency in people with aphasia (PWA). Methods & Procedures: Twenty-nine PWA and five control participantswere recruited via non-profit organizations and SLP networks. All participants were recorded while reading out loud a set ofsentences taken from the French version of the Boston Diagnostic Aphasia Examination. Three trained SLPs assessed the fluency of each sentence on a five-point qualitative scale. A forward-backward divergence segmentation and a clustering algorithm were used to compute, for each sentence, four automatic predictors of speech fluency: pseudo-syllable rate, speech ratio, rate of silent breaks, and standard deviation of pseudo-syllable length. The four predictors were finally combined into multivariate regression models (a multiplelinear regression – MLR, and two non-linear models) to predict the average SLP ratings of speech fluency, using a leave-one speaker-out validation scheme. Outcomes & Results: All models achieved accurate predictions of speech fluency ratings, with average root-mean-square errors as low as 0.5. The MLR yielded a correlation coefficient of 0.87 with reference ratings at the sentence level, and of 0.93 when aggregating the data for each participant. The inclusion of an additional predictor sensitive to repetitions improved further the predictions with a correlation coefficient of 0.91 at the sentence level, and of 0.96 at the participant level. Conclusions: The algorithms used in this study can constitute a cost-effective and reliable tool for the assessment of the speech fluency of patients with aphasia in read-aloud tasks. Perspectives for the assessment of spontaneous speech are discussed.

arxiv情報

著者 Lionel Fontan,Typhanie Prince,Aleksandra Nowakowska,Halima Sahraoui,Silvia Martinez-Ferreiro
発行日 2023-08-09 07:51:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク