「cs.SD」カテゴリーアーカイブ

Neural Diarization with Non-autoregressive Intermediate Attractors

投稿日: 2023年3月14日作成者: jarxiv

要約エンコーダ-デコーダベースのアトラクタ (EDA) を使用したエンドツー … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR

投稿日: 2023年3月14日作成者: jarxiv

要約エンドツーエンドの自動音声認識により、入力音声が文字に直接マッピングされま … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models

投稿日: 2023年3月14日作成者: jarxiv

要約このホワイトペーパーでは、多言語の事前トレーニングパラダイムで Con … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation

投稿日: 2023年3月14日作成者: jarxiv

要約ニューラルトランスデューサーは、自動音声認識 (ASR) のエンドツー … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

投稿日: 2023年3月14日作成者: jarxiv

要約オーディオビジュアルスピーチエンハンスメントは、オーディオ自体だけでなく、 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

投稿日: 2023年3月14日作成者: jarxiv

要約医療コンテキストにおける自動音声認識 (ASR) には、時間の節約、コスト … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Distribution Preserving Source Separation With Time Frequency Predictive Models

投稿日: 2023年3月13日作成者: jarxiv

要約最先端の方法の知覚的な欠点に対処することを目的とした、分布を維持するソース … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition

投稿日: 2023年3月13日作成者: jarxiv

要約音声感情認識 (SER) は、音声信号から人間の感情と感情状態を推測するこ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

投稿日: 2023年3月13日作成者: jarxiv

要約医療コンテキストにおける自動音声認識 (ASR) には、時間の節約、コスト … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

MIXPGD: Hybrid Adversarial Training for Speech Recognition Systems

投稿日: 2023年3月13日作成者: jarxiv

要約ディープニューラルネットワークに基づく自動音声認識 (ASR) システ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Neural Diarization with Non-autoregressive Intermediate Attractors

Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR

Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models

Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

Distribution Preserving Source Separation With Time Frequency Predictive Models

Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

MIXPGD: Hybrid Adversarial Training for Speech Recognition Systems

最近の投稿

最近のコメント

アーカイブ

カテゴリー