「cs.SD」カテゴリーアーカイブ

Towards dialect-inclusive recognition in a low-resource language: are balanced corpora the answer?

投稿日: 2023年7月17日作成者: jarxiv

要約 ASR システムは通常、話し言葉の「標準」向けに構築されており、非標準の方 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Cross-Language Speech Emotion Recognition Using Multimodal Dual Attention Transformers

投稿日: 2023年7月17日作成者: jarxiv

要約音声感情認識 (SER) は最近進歩しているにもかかわらず、最先端のシステ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Towards spoken dialect identification of Irish

投稿日: 2023年7月17日作成者: jarxiv

要約アイルランド語は、方言やアクセントの多様性に富んでいます。これは、リソー … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Edit Distance based RL for RNNT decoding

投稿日: 2023年7月17日作成者: jarxiv

要約 RNN-T は、さまざまなベンチマークテストで優れた WER を示し、シ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

AudioInceptionNeXt: TCL AI LAB Submission to EPIC-SOUND Audio-Based-Interaction-Recognition Challenge 2023

投稿日: 2023年7月17日作成者: jarxiv

要約このレポートでは、2023 Epic-Kitchen EPIC-SOUND … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Exploring the Integration of Large Language Models into Automatic Speech Recognition Systems: An Empirical Study

投稿日: 2023年7月14日作成者: jarxiv

要約このペーパーでは、書き起こしの精度を向上させるために、大規模言語モデル ( … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

投稿日: 2023年7月14日作成者: jarxiv

要約対照学習ベースの事前トレーニング方法は、最近、さまざまな分野で目覚ましい成 … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

KIT’s Multilingual Speech Translation System for IWSLT 2023

投稿日: 2023年7月13日作成者: jarxiv

要約既存の音声翻訳ベンチマークの多くは、高品質の録音条件でのネイティブ英語の音 … 続きを読む →

カテゴリー: cs.CL, cs.SD | コメントを受け付けていません

SpeechBlender: Speech Augmentation Framework for Mispronunciation Data Generation

投稿日: 2023年7月13日作成者: jarxiv

要約ラベル付きの第 2 言語 (L2) 音声データの欠如は、発音間違い検出モデ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Contextualized End-to-End Speech Recognition with Contextual Phrase Prediction Network

投稿日: 2023年7月13日作成者: jarxiv

要約コンテキスト情報は音声認識技術において重要な役割を果たしており、それをエン … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「cs.SD」カテゴリーアーカイブ

Towards dialect-inclusive recognition in a low-resource language: are balanced corpora the answer?

Cross-Language Speech Emotion Recognition Using Multimodal Dual Attention Transformers

Towards spoken dialect identification of Irish

Edit Distance based RL for RNNT decoding

AudioInceptionNeXt: TCL AI LAB Submission to EPIC-SOUND Audio-Based-Interaction-Recognition Challenge 2023

Exploring the Integration of Large Language Models into Automatic Speech Recognition Systems: An Empirical Study

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

KIT’s Multilingual Speech Translation System for IWSLT 2023

SpeechBlender: Speech Augmentation Framework for Mispronunciation Data Generation

Contextualized End-to-End Speech Recognition with Contextual Phrase Prediction Network

最近の投稿

最近のコメント

アーカイブ

カテゴリー