Enhancing Speech Articulation Analysis using a Geometric Transformation of the X-ray Microbeam Dataset

要約

音声分析には、音声の明瞭度を正確に分析することが不可欠です。
ただし、調音器官の X-Y 座標は話者の解剖学的構造とペレットの配置のばらつきに強く依存しており、X 線マイクロビーム データセット (XRMB) で解剖学的ランドマークをマッピングする既存の方法では、声道の解剖学的構造全体を捉えることができません。
この論文では、これらの測定の精度を向上させる新しい幾何学的変換を提案します。
私たちの変換は、正中矢状面に沿った解剖学的ランドマークの X-Y 座標を 6 つの相対的な尺度にマッピングします: 口唇開口部 (LA)、口唇突出部 (LP)、舌本体狭窄位置 (TTCL)、程度 (TBCD)、舌先端狭窄位置 (TTCL)、
学位 (TTCD)。
我々の新たな貢献は、推定された前咽頭線に向かって口蓋トレースを延長したことであり、これにより舌本体の収縮の測定が改善されました。

要約(オリジナル)

Accurate analysis of speech articulation is crucial for speech analysis. However, X-Y coordinates of articulators strongly depend on the anatomy of the speakers and the variability of pellet placements, and existing methods for mapping anatomical landmarks in the X-ray Microbeam Dataset (XRMB) fail to capture the entire anatomy of the vocal tract. In this paper, we propose a new geometric transformation that improves the accuracy of these measurements. Our transformation maps anatomical landmarks’ X-Y coordinates along the midsagittal plane onto six relative measures: Lip Aperture (LA), Lip Protusion (LP), Tongue Body Constriction Location (TTCL), Degree (TBCD), Tongue Tip Constriction Location (TTCL) and Degree (TTCD). Our novel contribution is the extension of the palate trace towards the inferred anterior pharyngeal line, which improves measurements of tongue body constriction.

arxiv情報

著者 Ahmed Adel Attia,Mark Tiede,Carol Y. Espy-Wilson
発行日 2023-09-28 16:44:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.AS パーマリンク