eess.AS」カテゴリーアーカイブ

Emphasizing Unseen Words: New Vocabulary Acquisition for End-to-End Speech Recognition

要約 人間の言語の動的な性質により、自動音声認識 (ASR) システムは新しい語 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Emphasizing Unseen Words: New Vocabulary Acquisition for End-to-End Speech Recognition はコメントを受け付けていません

Knowledge-aware Bayesian Co-attention for Multimodal Emotion Recognition

要約 マルチモーダル感情認識は、さまざまなモダリティを融合して人間の感情を予測す … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Knowledge-aware Bayesian Co-attention for Multimodal Emotion Recognition はコメントを受け付けていません

A DNN based Normalized Time-frequency Weighted Criterion for Robust Wideband DoA Estimation

要約 ディープ ニューラル ネットワーク (DNN) は、ノイズの多い環境での発 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, eess.SP | A DNN based Normalized Time-frequency Weighted Criterion for Robust Wideband DoA Estimation はコメントを受け付けていません

Emphasizing Unseen Words: New Vocabulary Acquisition for End-to-End Speech Recognition

要約 人間の言語の動的な性質により、自動音声認識 (ASR) システムは新しい語 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Emphasizing Unseen Words: New Vocabulary Acquisition for End-to-End Speech Recognition はコメントを受け付けていません

Knowledge-aware Bayesian Co-attention for Multimodal Emotion Recognition

要約 マルチモーダル感情認識は、さまざまなモダリティを融合して人間の感情を予測す … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Knowledge-aware Bayesian Co-attention for Multimodal Emotion Recognition はコメントを受け付けていません

Towards Measuring and Scoring Speaker Diarization Fairness

要約 話者ダイアライゼーション、つまり「誰がいつ話したか」を見つけるタスクは、現 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Towards Measuring and Scoring Speaker Diarization Fairness はコメントを受け付けていません

A Sidecar Separator Can Convert a Single-Speaker Speech Recognition System to a Multi-Speaker One

要約 自動音声認識 (ASR) は、一般的な非重複環境で適切に機能しますが、マル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | A Sidecar Separator Can Convert a Single-Speaker Speech Recognition System to a Multi-Speaker One はコメントを受け付けていません

JEIT: Joint End-to-End Model and Internal Language Model Training for Speech Recognition

要約 エンドツーエンド (E2E) モデルと内部言語モデル (ILM) のジョイ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | JEIT: Joint End-to-End Model and Internal Language Model Training for Speech Recognition はコメントを受け付けていません

Modular Hybrid Autoregressive Transducer

要約 トランスデューサには明確に分離された音響モデル (AM)、言語モデル (L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | Modular Hybrid Autoregressive Transducer はコメントを受け付けていません

Towards Building Text-To-Speech Systems for the Next Billion Users

要約 ディープ ラーニング ベースのテキスト読み上げ (TTS) システムは、モ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Towards Building Text-To-Speech Systems for the Next Billion Users はコメントを受け付けていません