「eess.AS」カテゴリーアーカイブ

Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation

投稿日: 2023年3月14日作成者: jarxiv

要約ニューラルトランスデューサーは、自動音声認識 (ASR) のエンドツー … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

投稿日: 2023年3月14日作成者: jarxiv

要約オーディオビジュアルスピーチエンハンスメントは、オーディオ自体だけでなく、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

投稿日: 2023年3月14日作成者: jarxiv

要約医療コンテキストにおける自動音声認識 (ASR) には、時間の節約、コスト … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Distribution Preserving Source Separation With Time Frequency Predictive Models

投稿日: 2023年3月13日作成者: jarxiv

要約最先端の方法の知覚的な欠点に対処することを目的とした、分布を維持するソース … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition

投稿日: 2023年3月13日作成者: jarxiv

要約音声感情認識 (SER) は、音声信号から人間の感情と感情状態を推測するこ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

投稿日: 2023年3月13日作成者: jarxiv

要約医療コンテキストにおける自動音声認識 (ASR) には、時間の節約、コスト … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

MIXPGD: Hybrid Adversarial Training for Speech Recognition Systems

投稿日: 2023年3月13日作成者: jarxiv

要約ディープニューラルネットワークに基づく自動音声認識 (ASR) システ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Robust Knowledge Distillation from RNN-T Models With Noisy Training Labels Using Full-Sum Loss

投稿日: 2023年3月13日作成者: jarxiv

要約この作業では、知識の蒸留 (KD) を研究し、リカレントニューラルネッ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS, stat.ML | コメントを受け付けていません

Deformable Temporal Convolutional Networks for Monaural Noisy Reverberant Speech Separation

投稿日: 2023年3月13日作成者: jarxiv

要約音声分離モデルは、多くの音声処理アプリケーションで個々の話者を分離するため … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

An End-to-End Neural Network for Image-to-Audio Transformation

投稿日: 2023年3月13日作成者: jarxiv

要約このペーパーでは、リソースの少ないパーソナルコンピューティングデバイス … 続きを読む →

カテゴリー: cs.AI, cs.NE, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

Distribution Preserving Source Separation With Time Frequency Predictive Models

Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

MIXPGD: Hybrid Adversarial Training for Speech Recognition Systems

Robust Knowledge Distillation from RNN-T Models With Noisy Training Labels Using Full-Sum Loss

Deformable Temporal Convolutional Networks for Monaural Noisy Reverberant Speech Separation

An End-to-End Neural Network for Image-to-Audio Transformation

最近の投稿

最近のコメント

アーカイブ

カテゴリー