「eess.AS」カテゴリーアーカイブ

A Review of Machine Learning Methods Applied to Structural Dynamics and Vibroacoustic

投稿日: 2023年7月21日作成者: jarxiv

要約機械学習 (ML) の使用はいくつかの分野に急速に広がり、構造力学と振動音 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Globally Normalising the Transducer for Streaming Speech Recognition

投稿日: 2023年7月21日作成者: jarxiv

要約トランスデューサ (RNN トランスデューサやコンフォーマトランスデュー … 続きを読む →

カテゴリー: 68T10, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Progressive distillation diffusion for raw music generation

投稿日: 2023年7月21日作成者: jarxiv

要約このペーパーは、生のオーディオファイルを生成するタスクに新しい深層学習ア … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Brain2Music: Reconstructing Music from Human Brain Activity

投稿日: 2023年7月21日作成者: jarxiv

要約人間の脳の活動から経験を再構築するプロセスは、脳が世界をどのように解釈し表 … 続きを読む →

カテゴリー: cs.LG, cs.SD, eess.AS, q-bio.NC | コメントを受け付けていません

Vesper: A Compact and Effective Pretrained Model for Speech Emotion Recognition

投稿日: 2023年7月21日作成者: jarxiv

要約この論文では、一般的な大規模事前学習モデル (PTM) を音声感情認識タス … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

A Textless Metric for Speech-to-Speech Comparison

投稿日: 2023年7月21日作成者: jarxiv

要約この論文では、テキストのトランスクリプトに依存せずに音声発話を比較するため … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Cross-Corpus Multilingual Speech Emotion Recognition: Amharic vs. Other Languages

投稿日: 2023年7月21日作成者: jarxiv

要約従来の音声感情認識 (SER) タスクでは、特定の言語の分類子が、同じ言語 … 続きを読む →

カテゴリー: cs.CL, cs.NE, cs.SD, eess.AS | コメントを受け付けていません

MASR: Metadata Aware Speech Representation

投稿日: 2023年7月21日作成者: jarxiv

要約近年、音声表現学習は主に自己教師あり学習 (SSL) タスクとして構築され … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Integrating Pretrained ASR and LM to Perform Sequence Generation for Spoken Language Understanding

投稿日: 2023年7月21日作成者: jarxiv

要約事前トレーニング済み音声認識 (ASR) と言語モデル (LM) を SL … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

投稿日: 2023年7月20日作成者: jarxiv

要約対照学習に基づくクロスモダリティ事前トレーニング手法は、最近、さまざまな分 … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

A Review of Machine Learning Methods Applied to Structural Dynamics and Vibroacoustic

Globally Normalising the Transducer for Streaming Speech Recognition

Progressive distillation diffusion for raw music generation

Brain2Music: Reconstructing Music from Human Brain Activity

Vesper: A Compact and Effective Pretrained Model for Speech Emotion Recognition

A Textless Metric for Speech-to-Speech Comparison

Cross-Corpus Multilingual Speech Emotion Recognition: Amharic vs. Other Languages

MASR: Metadata Aware Speech Representation

Integrating Pretrained ASR and LM to Perform Sequence Generation for Spoken Language Understanding

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー