eess.AS」カテゴリーアーカイブ

Ensemble knowledge distillation of self-supervised speech models

要約 蒸留された自己教師ありモデルは、近年、競争力のあるパフォーマンスと効率を示 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Ensemble knowledge distillation of self-supervised speech models はコメントを受け付けていません

Improving Massively Multilingual ASR With Auxiliary CTC Objectives

要約 多言語自動音声認識 (ASR) モデルにより、音声テクノロジの使いやすさが … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Improving Massively Multilingual ASR With Auxiliary CTC Objectives はコメントを受け付けていません

ProsAudit, a prosodic benchmark for self-supervised speech models

要約 ProsAudit は、自己教師あり学習 (SSL) 音声モデルの構造韻律 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ProsAudit, a prosodic benchmark for self-supervised speech models はコメントを受け付けていません

Fast and accurate factorized neural transducer for text adaption of end-to-end speech recognition models

要約 ニューラル トランスデューサは、その自然なストリーミング機能により、現在、 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Fast and accurate factorized neural transducer for text adaption of end-to-end speech recognition models はコメントを受け付けていません

Metric-oriented Speech Enhancement using Diffusion Probabilistic Model

要約 ディープ ニューラル ネットワーク ベースの音声強調技術は、ペアのトレーニ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Metric-oriented Speech Enhancement using Diffusion Probabilistic Model はコメントを受け付けていません

Evaluating Automatic Speech Recognition in an Incremental Setting

要約 自動音声認識の信頼性が向上したことで、日常的に使用されるようになりました。 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Evaluating Automatic Speech Recognition in an Incremental Setting はコメントを受け付けていません

ProsAudit, a prosodic benchmark for self-supervised speech models

要約 ProsAudit は、自己教師あり学習 (SSL) 音声モデルの構造韻律 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ProsAudit, a prosodic benchmark for self-supervised speech models はコメントを受け付けていません

Unsupervised Noise adaptation using Data Simulation

要約 ディープ ニューラル ネットワーク ベースの音声強調アプローチは、教師あり … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Unsupervised Noise adaptation using Data Simulation はコメントを受け付けていません

Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition

要約 スピーチエンハンスメント (SE) は、ダウンストリームの自動音声認識 ( … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition はコメントを受け付けていません

UML: A Universal Monolingual Output Layer for Multilingual ASR

要約 ワード ピース モデル (WPM) は、最先端のエンド ツー エンド自動音 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | UML: A Universal Monolingual Output Layer for Multilingual ASR はコメントを受け付けていません