cs.SD」カテゴリーアーカイブ

Efficient Speech Translation with Dynamic Latent Perceivers

要約 近年、トランスフォーマーは音声翻訳の主要なアーキテクチャであり、翻訳品質の … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Efficient Speech Translation with Dynamic Latent Perceivers はコメントを受け付けていません

Improving Accented Speech Recognition with Multi-Domain Training

要約 自己教師あり学習の台頭により、自動音声認識 (ASR) システムは現在、さ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | Improving Accented Speech Recognition with Multi-Domain Training はコメントを受け付けていません

DECAR: Deep Clustering for learning general-purpose Audio Representations

要約 汎用の音声表現を学習するための自己教師あり事前トレーニング アプローチであ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | DECAR: Deep Clustering for learning general-purpose Audio Representations はコメントを受け付けていません

Improving Prosody for Cross-Speaker Style Transfer by Semi-Supervised Style Extractor and Hierarchical Modeling in Speech Synthesis

要約 音声合成における話者間スタイル転送は、スタイルをソース スピーカーからター … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Improving Prosody for Cross-Speaker Style Transfer by Semi-Supervised Style Extractor and Hierarchical Modeling in Speech Synthesis はコメントを受け付けていません

A Study on Bias and Fairness In Deep Speaker Recognition

要約 個人を認証し、サービスをパーソナライズする手段として話者認識 (SR) シ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | A Study on Bias and Fairness In Deep Speaker Recognition はコメントを受け付けていません

Multi-Microphone Speaker Separation by Spatial Regions

要約 残響のあるマルチマイク録音の領域ベースのソース分離のタスクを検討します。 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Multi-Microphone Speaker Separation by Spatial Regions はコメントを受け付けていません

Learning Audio Features with Metadata and Contrastive Learning

要約 アノテーションをエンドツーエンドで使用する教師あり学習に基づく方法は、分類 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Learning Audio Features with Metadata and Contrastive Learning はコメントを受け付けていません

Perceptual-Neural-Physical Sound Matching

要約 サウンド マッチング アルゴリズムは、パラメトリック オーディオ合成によっ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Perceptual-Neural-Physical Sound Matching はコメントを受け付けていません

Improving the Intent Classification accuracy in Noisy Environment

要約 意図分類は、主にエンド ツー エンドのニューラル モデルでアプローチできる … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Improving the Intent Classification accuracy in Noisy Environment はコメントを受け付けていません

Articulation GAN: Unsupervised modeling of articulatory learning

要約 ジェネレーティブ ディープ ニューラル ネットワークは音声合成に広く使用さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Articulation GAN: Unsupervised modeling of articulatory learning はコメントを受け付けていません