「eess.AS」カテゴリーアーカイブ

Underwater Acoustic Signal Recognition Based on Salient Features

投稿日: 2023年12月21日作成者: jarxiv

要約技術の急速な進歩に伴い、複雑な環境における水中の音響信号の認識がますます重 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Lattice Rescoring Based on Large Ensemble of Complementary Neural Language Models

投稿日: 2023年12月21日作成者: jarxiv

要約自動音声認識 (ASR) 仮説に基づく格子再スコアリングに高度な神経言語モ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Stable Distillation: Regularizing Continued Pre-training for Low-Resource Automatic Speech Recognition

投稿日: 2023年12月21日作成者: jarxiv

要約既存の SSL モデルをターゲットドメインに適応させるための継続的な自己 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

SoftCorrect: Error Correction with Soft Detection for Automatic Speech Recognition

投稿日: 2023年12月21日作成者: jarxiv

要約自動音声認識 (ASR) におけるエラー修正は、ASR モデルによって生成 … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

FusDom: Combining In-Domain and Out-of-Domain Knowledge for Continuous Self-Supervised Learning

投稿日: 2023年12月21日作成者: jarxiv

要約継続的な事前トレーニング (CP) には、ターゲットドメインへの適応や、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Evaluating Speech-in-Speech Perception via a Humanoid Robot

投稿日: 2023年12月20日作成者: jarxiv

要約背景の話者によって隠蔽される音声知覚の根本的なメカニズム、つまり日常の一般 … 続きを読む →

カテゴリー: cs.RO, cs.SD, eess.AS | コメントを受け付けていません

Emotion Rendering for Conversational Speech Synthesis with Heterogeneous Graph-Based Context Modeling

投稿日: 2023年12月20日作成者: jarxiv

要約会話型音声合成 (CSS) は、会話環境内で適切な韻律と感情の抑揚を備えた … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Automated speech audiometry: Can it work using open-source pre-trained Kaldi-NL automatic speech recognition?

投稿日: 2023年12月20日作成者: jarxiv

要約実用的な音声聴力測定ツールは、さまざまな年齢や聴力状態の集団の聴力スクリー … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

SpokesBiz — an Open Corpus of Conversational Polish

投稿日: 2023年12月20日作成者: jarxiv

要約この文書は、CLARIN-BIZ プロジェクト内で開発され、650 時間以 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

StyleSpeech: Self-supervised Style Enhancing with VQ-VAE-based Pre-training for Expressive Audiobook Speech Synthesis

投稿日: 2023年12月20日作成者: jarxiv

要約オーディオブック用の合成音声の表現品質は、一般化されたモデルアーキテクチ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Underwater Acoustic Signal Recognition Based on Salient Features

Lattice Rescoring Based on Large Ensemble of Complementary Neural Language Models

Stable Distillation: Regularizing Continued Pre-training for Low-Resource Automatic Speech Recognition

SoftCorrect: Error Correction with Soft Detection for Automatic Speech Recognition

FusDom: Combining In-Domain and Out-of-Domain Knowledge for Continuous Self-Supervised Learning

Evaluating Speech-in-Speech Perception via a Humanoid Robot

Emotion Rendering for Conversational Speech Synthesis with Heterogeneous Graph-Based Context Modeling

Automated speech audiometry: Can it work using open-source pre-trained Kaldi-NL automatic speech recognition?

SpokesBiz — an Open Corpus of Conversational Polish

StyleSpeech: Self-supervised Style Enhancing with VQ-VAE-based Pre-training for Expressive Audiobook Speech Synthesis

最近の投稿

最近のコメント

アーカイブ

カテゴリー