eess.AS」カテゴリーアーカイブ

Improving the Intent Classification accuracy in Noisy Environment

要約 意図分類は、主にエンド ツー エンドのニューラル モデルでアプローチできる … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Improving the Intent Classification accuracy in Noisy Environment はコメントを受け付けていません

Articulation GAN: Unsupervised modeling of articulatory learning

要約 ジェネレーティブ ディープ ニューラル ネットワークは音声合成に広く使用さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Articulation GAN: Unsupervised modeling of articulatory learning はコメントを受け付けていません

Neural Diarization with Non-autoregressive Intermediate Attractors

要約 エンコーダ-デコーダベースのアトラクタ (EDA) を使用したエンド ツー … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Neural Diarization with Non-autoregressive Intermediate Attractors はコメントを受け付けていません

Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR

要約 エンドツーエンドの自動音声認識により、入力音声が文字に直接マッピングされま … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR はコメントを受け付けていません

DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

要約 個々の発話のコレクションである現在のテキスト読み上げ (TTS) データセ … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech はコメントを受け付けていません

Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models

要約 このホワイト ペーパーでは、多言語の事前トレーニング パラダイムで Con … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models はコメントを受け付けていません

Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation

要約 ニューラル トランスデューサーは、自動音声認識 (ASR) のエンド ツー … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation はコメントを受け付けていません

LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders

要約 オーディオビジュアルスピーチエンハンスメントは、オーディオ自体だけでなく、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders はコメントを受け付けていません

Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings

要約 医療コンテキストにおける自動音声認識 (ASR) には、時間の節約、コスト … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings はコメントを受け付けていません

Distribution Preserving Source Separation With Time Frequency Predictive Models

要約 最先端の方法の知覚的な欠点に対処することを目的とした、分布を維持するソース … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Distribution Preserving Source Separation With Time Frequency Predictive Models はコメントを受け付けていません