A Study on the Reliability of Automatic Dysarthric Speech Assessments

要約

構音障害の評価を自動化すると、手動および主観的な評価の現在の限界に対処する、効果的で低コストのツールを開発する機会が得られます。
それにもかかわらず、現在のアプローチが構音障害に関連した発話パターンに依存しているのか、それとも外部要因に依存しているのかは不明です。
私たちは構音障害のパターンをより明確に理解することを目指しています。
この点で、私たちは録音におけるノイズの影響を加算と低減の両方を通じて研究しています。
私たちは、患者レベルで、より解釈しやすい方法で特徴抽出器とモデルを視覚化および比較するための新しい方法を設計および実装します。
データセットを話者ベースで分割した UA-Speech データセットを使用します。
文献で報告されている結果は、そのような分割とは無関係に行われたようであり、データ漏洩のために過信されている可能性のあるモデルにつながっています。
これらの結果により、信頼性の高い自動構音障害評価システムを確立するための要件に関する研究コミュニティの意識が高まることを願っています。

要約(オリジナル)

Automating dysarthria assessments offers the opportunity to develop effective, low-cost tools that address the current limitations of manual and subjective assessments. Nonetheless, it is unclear whether current approaches rely on dysarthria-related speech patterns or external factors. We aim toward obtaining a clearer understanding of dysarthria patterns. To this extent, we study the effects of noise in recordings, both through addition and reduction. We design and implement a new method for visualizing and comparing feature extractors and models, at a patient level, in a more interpretable way. We use the UA-Speech dataset with a speaker-based split of the dataset. Results reported in the literature appear to have been done irrespective of such split, leading to models that may be overconfident due to data-leakage. We hope that these results raise awareness in the research community regarding the requirements for establishing reliable automatic dysarthria assessment systems.

arxiv情報

著者 Xavier F. Cadet,Ranya Aloufi,Sara Ahmadi-Abhari,Hamed Haddadi
発行日 2023-06-07 11:04:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク