「eess.AS」カテゴリーアーカイブ

Multi-Microphone Speaker Separation by Spatial Regions

投稿日: 2023年3月14日作成者: jarxiv

要約残響のあるマルチマイク録音の領域ベースのソース分離のタスクを検討します。 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Learning Audio Features with Metadata and Contrastive Learning

投稿日: 2023年3月14日作成者: jarxiv

要約アノテーションをエンドツーエンドで使用する教師あり学習に基づく方法は、分類 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Perceptual-Neural-Physical Sound Matching

投稿日: 2023年3月14日作成者: jarxiv

要約サウンドマッチングアルゴリズムは、パラメトリックオーディオ合成によっ … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Learning ASR pathways: A sparse multilingual ASR model

投稿日: 2023年3月14日作成者: jarxiv

要約ニューラルネットワークプルーニングは、自動音声認識 (ASR) モデル … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Improving the Intent Classification accuracy in Noisy Environment

投稿日: 2023年3月14日作成者: jarxiv

要約意図分類は、主にエンドツーエンドのニューラルモデルでアプローチできる … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Articulation GAN: Unsupervised modeling of articulatory learning

投稿日: 2023年3月14日作成者: jarxiv

要約ジェネレーティブディープニューラルネットワークは音声合成に広く使用さ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Neural Diarization with Non-autoregressive Intermediate Attractors

投稿日: 2023年3月14日作成者: jarxiv

要約エンコーダ-デコーダベースのアトラクタ (EDA) を使用したエンドツー … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR

投稿日: 2023年3月14日作成者: jarxiv

要約エンドツーエンドの自動音声認識により、入力音声が文字に直接マッピングされま … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

投稿日: 2023年3月14日作成者: jarxiv

要約個々の発話のコレクションである現在のテキスト読み上げ (TTS) データセ … 続きを読む →

カテゴリー: cs.AI, cs.CL, eess.AS | コメントを受け付けていません

Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models

投稿日: 2023年3月14日作成者: jarxiv

要約このホワイトペーパーでは、多言語の事前トレーニングパラダイムで Con … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Multi-Microphone Speaker Separation by Spatial Regions

Learning Audio Features with Metadata and Contrastive Learning

Perceptual-Neural-Physical Sound Matching

Learning ASR pathways: A sparse multilingual ASR model

Improving the Intent Classification accuracy in Noisy Environment

Articulation GAN: Unsupervised modeling of articulatory learning

Neural Diarization with Non-autoregressive Intermediate Attractors

Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR

DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

Accidental Learners: Spoken Language Identification in Multilingual Self-Supervised Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー