「eess.AS」カテゴリーアーカイブ

Cross-Language Speech Emotion Recognition Using Multimodal Dual Attention Transformers

投稿日: 2023年6月28日作成者: jarxiv

要約音声感情認識 (SER) は最近進歩しているにもかかわらず、最先端のシステ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Cross-Attention is Not Enough: Incongruity-Aware Hierarchical Multimodal Sentiment Analysis and Emotion Recognition

投稿日: 2023年6月28日作成者: jarxiv

要約感情的なコンピューティングタスクに複数のモダリティを融合することは、パフ … 続きを読む →

カテゴリー: cs.CL, cs.MM, eess.AS, eess.IV | コメントを受け付けていません

3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation Disentanglement

投稿日: 2023年6月28日作成者: jarxiv

要約音声発話内の相関関係のない情報を解きほぐすことは、音声コミュニティ内での重 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Debiased Automatic Speech Recognition for Dysarthric Speech via Sample Reweighting with Sample Affinity Test

投稿日: 2023年6月28日作成者: jarxiv

要約深層学習に基づく自動音声認識システムは、主に経験的リスク最小化 (ERM) … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Iterative autoregression: a novel trick to improve your low-latency speech enhancement model

投稿日: 2023年6月28日作成者: jarxiv

要約ストリーミングモデルは、リアルタイム音声強調ツールの重要なコンポーネント … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Large-scale unsupervised audio pre-training for video-to-speech synthesis

投稿日: 2023年6月28日作成者: jarxiv

要約ビデオ音声合成は、話者の無声ビデオから音声信号を再構築するタスクです。こ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3

投稿日: 2023年6月27日作成者: jarxiv

要約このレポートでは、サウンドデミキシングチャレンジ 2023 の音楽デミ … 続きを読む →

カテゴリー: cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Addressing Cold Start Problem for End-to-end Automatic Speech Scoring

投稿日: 2023年6月27日作成者: jarxiv

要約自動音声採点/評価システムの統合は、第二言語スピーキング教育の重要な側面と … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

The Singing Voice Conversion Challenge 2023

投稿日: 2023年6月27日作成者: jarxiv

要約共通のデータセットに基づいてさまざまな音声変換 (VC) システムを比較し … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition

投稿日: 2023年6月27日作成者: jarxiv

要約音声感情認識は、人間とコンピューターの対話において重要な役割を果たします。 … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Cross-Language Speech Emotion Recognition Using Multimodal Dual Attention Transformers

Cross-Attention is Not Enough: Incongruity-Aware Hierarchical Multimodal Sentiment Analysis and Emotion Recognition

3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation Disentanglement

Debiased Automatic Speech Recognition for Dysarthric Speech via Sample Reweighting with Sample Affinity Test

Iterative autoregression: a novel trick to improve your low-latency speech enhancement model

Large-scale unsupervised audio pre-training for video-to-speech synthesis

Sound Demixing Challenge 2023 Music Demixing Track Technical Report: TFC-TDF-UNet v3

Addressing Cold Start Problem for End-to-end Automatic Speech Scoring

The Singing Voice Conversion Challenge 2023

Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー