eess.AS」カテゴリーアーカイブ

Metric-oriented Speech Enhancement using Diffusion Probabilistic Model

要約 ディープ ニューラル ネットワーク ベースの音声強調技術は、ペアのトレーニ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Metric-oriented Speech Enhancement using Diffusion Probabilistic Model はコメントを受け付けていません

Evaluating Automatic Speech Recognition in an Incremental Setting

要約 自動音声認識の信頼性が向上したことで、日常的に使用されるようになりました。 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Evaluating Automatic Speech Recognition in an Incremental Setting はコメントを受け付けていません

ProsAudit, a prosodic benchmark for self-supervised speech models

要約 ProsAudit は、自己教師あり学習 (SSL) 音声モデルの構造韻律 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | ProsAudit, a prosodic benchmark for self-supervised speech models はコメントを受け付けていません

Unsupervised Noise adaptation using Data Simulation

要約 ディープ ニューラル ネットワーク ベースの音声強調アプローチは、教師あり … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Unsupervised Noise adaptation using Data Simulation はコメントを受け付けていません

Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition

要約 スピーチエンハンスメント (SE) は、ダウンストリームの自動音声認識 ( … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition はコメントを受け付けていません

UML: A Universal Monolingual Output Layer for Multilingual ASR

要約 ワード ピース モデル (WPM) は、最先端のエンド ツー エンド自動音 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | UML: A Universal Monolingual Output Layer for Multilingual ASR はコメントを受け付けていません

Improving Contextual Spelling Correction by External Acoustics Attention and Semantic Aware Data Augmentation

要約 名前、場所などのコンテキスト情報を使用して、エンドツーエンド (E2E) … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Improving Contextual Spelling Correction by External Acoustics Attention and Semantic Aware Data Augmentation はコメントを受け付けていません

Exploring Effective Distillation of Self-Supervised Speech Models for Automatic Speech Recognition

要約 近年、音声処理における自己教師あり学習 (SSL) が大きく進歩しています … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Exploring Effective Distillation of Self-Supervised Speech Models for Automatic Speech Recognition はコメントを受け付けていません

MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition

要約 通常、エンド ツー エンドの自動音声認識 (ASR) は、ドメイン シフト … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition はコメントを受け付けていません

Chord-Conditioned Melody Harmonization with Controllable Harmonicity

要約 旋律のハーモナイゼーションは、ヨハン・セバスティアン・バッハが作曲したコラ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Chord-Conditioned Melody Harmonization with Controllable Harmonicity はコメントを受け付けていません