「cs.SD」カテゴリーアーカイブ

Fast and accurate factorized neural transducer for text adaption of end-to-end speech recognition models

投稿日: 2023年2月24日作成者: jarxiv

要約ニューラルトランスデューサは、その自然なストリーミング機能により、現在、 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Metric-oriented Speech Enhancement using Diffusion Probabilistic Model

投稿日: 2023年2月24日作成者: jarxiv

要約ディープニューラルネットワークベースの音声強調技術は、ペアのトレーニ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Evaluating Automatic Speech Recognition in an Incremental Setting

投稿日: 2023年2月24日作成者: jarxiv

要約自動音声認識の信頼性が向上したことで、日常的に使用されるようになりました。 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

ProsAudit, a prosodic benchmark for self-supervised speech models

投稿日: 2023年2月24日作成者: jarxiv

要約 ProsAudit は、自己教師あり学習 (SSL) 音声モデルの構造韻律 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Unsupervised Noise adaptation using Data Simulation

投稿日: 2023年2月24日作成者: jarxiv

要約ディープニューラルネットワークベースの音声強調アプローチは、教師あり … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition

投稿日: 2023年2月23日作成者: jarxiv

要約スピーチエンハンスメント (SE) は、ダウンストリームの自動音声認識 ( … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

UML: A Universal Monolingual Output Layer for Multilingual ASR

投稿日: 2023年2月23日作成者: jarxiv

要約ワードピースモデル (WPM) は、最先端のエンドツーエンド自動音 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Improving Contextual Spelling Correction by External Acoustics Attention and Semantic Aware Data Augmentation

投稿日: 2023年2月23日作成者: jarxiv

要約名前、場所などのコンテキスト情報を使用して、エンドツーエンド (E2E) … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Exploring Effective Distillation of Self-Supervised Speech Models for Automatic Speech Recognition

投稿日: 2023年2月23日作成者: jarxiv

要約近年、音声処理における自己教師あり学習 (SSL) が大きく進歩しています … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition

投稿日: 2023年2月23日作成者: jarxiv

要約通常、エンドツーエンドの自動音声認識 (ASR) は、ドメインシフト … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Fast and accurate factorized neural transducer for text adaption of end-to-end speech recognition models

Metric-oriented Speech Enhancement using Diffusion Probabilistic Model

Evaluating Automatic Speech Recognition in an Incremental Setting

ProsAudit, a prosodic benchmark for self-supervised speech models

Unsupervised Noise adaptation using Data Simulation

Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition

UML: A Universal Monolingual Output Layer for Multilingual ASR

Improving Contextual Spelling Correction by External Acoustics Attention and Semantic Aware Data Augmentation

Exploring Effective Distillation of Self-Supervised Speech Models for Automatic Speech Recognition

MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー