「eess.AS」カテゴリーアーカイブ

Discrete Acoustic Space for an Efficient Sampling in Neural Text-To-Speech

投稿日: 2023年9月15日作成者: jarxiv

要約有名な変分オートエンコーダ (VAE) およびベクトル量子化変分オートエン … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Direct Text to Speech Translation System using Acoustic Units

投稿日: 2023年9月15日作成者: jarxiv

要約本稿では、離散音響ユニットを用いたテキストから音声への直接翻訳システムを提 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Incorporating Class-based Language Model for Named Entity Recognition in Factorized Neural Transducer

投稿日: 2023年9月15日作成者: jarxiv

要約近年の音声認識におけるエンドツーエンド (E2E) モデルの目覚ましい進歩 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

CoLLD: Contrastive Layer-to-layer Distillation for Compressing Multilingual Pre-trained Speech Encoders

投稿日: 2023年9月15日作成者: jarxiv

要約大規模な自己監視型の事前トレーニング済み音声エンコーダは、音声認識および翻 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

L1-aware Multilingual Mispronunciation Detection Framework

投稿日: 2023年9月15日作成者: jarxiv

要約話者の母語 (L1) と非母語 (L2) の間の音韻の不一致は、発音の誤り … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Explaining Speech Classification Models via Word-Level Audio Segments and Paralinguistic Features

投稿日: 2023年9月15日作成者: jarxiv

要約 eXplainable AI (XAI) の最近の進歩により、視覚、言語、 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

The complementary roles of non-verbal cues for Robust Pronunciation Assessment

投稿日: 2023年9月15日作成者: jarxiv

要約発音評価システムの研究は、非ネイティブ (L2) 音声の音声および音韻論的 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Echotune: A Modular Extractor Leveraging the Variable-Length Nature of Speech in ASR Tasks

投稿日: 2023年9月15日作成者: jarxiv

要約 Transformer アーキテクチャは自動音声認識 (ASR) タスクに … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

SingFake: Singing Voice Deepfake Detection

投稿日: 2023年9月15日作成者: jarxiv

要約歌声合成の台頭は、アーティストや業界関係者に、音声の不正使用をめぐる重大な … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Speech-to-Speech Translation with Discrete-Unit-Based Style Transfer

投稿日: 2023年9月15日作成者: jarxiv

要約個別の自己教師あり表現を使用した直接音声対音声翻訳 (S2ST) は、驚く … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません