Boosting Local Spectro-Temporal Features for Speech Analysis

要約

音声認識のコンテキストで電話の分類の問題を導入し、電話の分類に使用できる局所的な分光時間的特徴のいくつかのセットを調査します。
特に、物体検出に一般的に使用される 2 つの特徴セット (Haar 特徴と SVM 分類された勾配ヒストグラム (HoG)) を使用した電話分類の予備結果をいくつか示します。

要約(オリジナル)

We introduce the problem of phone classification in the context of speech recognition, and explore several sets of local spectro-temporal features that can be used for phone classification. In particular, we present some preliminary results for phone classification using two sets of features that are commonly used for object detection: Haar features and SVM-classified Histograms of Gradients (HoG).

arxiv情報

著者 Michael Guerzhoy
発行日 2023-07-28 05:35:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク