eess.AS」カテゴリーアーカイブ

Multi-Microphone Speaker Separation by Spatial Regions

要約 残響のあるマルチマイク録音の領域ベースのソース分離のタスクを検討します。 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Multi-Microphone Speaker Separation by Spatial Regions はコメントを受け付けていません

Learning Audio Features with Metadata and Contrastive Learning

要約 アノテーションをエンドツーエンドで使用する教師あり学習に基づく方法は、分類 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Learning Audio Features with Metadata and Contrastive Learning はコメントを受け付けていません

Perceptual-Neural-Physical Sound Matching

要約 サウンド マッチング アルゴリズムは、パラメトリック オーディオ合成によっ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Perceptual-Neural-Physical Sound Matching はコメントを受け付けていません

Learning ASR pathways: A sparse multilingual ASR model

要約 ニューラル ネットワーク プルーニングは、自動音声認識 (ASR) モデル … 続きを読む

カテゴリー: cs.CL, eess.AS | Learning ASR pathways: A sparse multilingual ASR model はコメントを受け付けていません

Improving the Intent Classification accuracy in Noisy Environment

要約 意図分類は、主にエンド ツー エンドのニューラル モデルでアプローチできる … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Improving the Intent Classification accuracy in Noisy Environment はコメントを受け付けていません

Articulation GAN: Unsupervised modeling of articulatory learning

要約 ジェネレーティブ ディープ ニューラル ネットワークは音声合成に広く使用さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Articulation GAN: Unsupervised modeling of articulatory learning はコメントを受け付けていません

Neural Diarization with Non-autoregressive Intermediate Attractors

要約 エンコーダ-デコーダベースのアトラクタ (EDA) を使用したエンド ツー … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Neural Diarization with Non-autoregressive Intermediate Attractors はコメントを受け付けていません

Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR

要約 エンドツーエンドの自動音声認識により、入力音声が文字に直接マッピングされま … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR はコメントを受け付けていません

DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

要約 個々の発話のコレクションである現在のテキスト読み上げ (TTS) データセ … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech はコメントを受け付けていません

Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models

要約 このホワイト ペーパーでは、多言語の事前トレーニング パラダイムで Con … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models はコメントを受け付けていません