eess.AS」カテゴリーアーカイブ

Exploring Attention Mechanisms for Multimodal Emotion Recognition in an Emergency Call Center Corpus

要約 人間の意思決定を強化する感情検出テクノロジーは、現実世界のアプリケーション … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Exploring Attention Mechanisms for Multimodal Emotion Recognition in an Emergency Call Center Corpus はコメントを受け付けていません

Speaker Embeddings as Individuality Proxy for Voice Stress Detection

要約 話者の精神状態が音声を調整するため、認知的または身体的負荷によってもたらさ … 続きを読む

カテゴリー: cs.LG, eess.AS | Speaker Embeddings as Individuality Proxy for Voice Stress Detection はコメントを受け付けていません

EmotionNAS: Two-stream Neural Architecture Search for Speech Emotion Recognition

要約 音声感情認識 (SER) は、人間とコンピューターの対話における重要な研究 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | EmotionNAS: Two-stream Neural Architecture Search for Speech Emotion Recognition はコメントを受け付けていません

Reconstructing Human Expressiveness in Piano Performances with a Transformer Network

要約 コンピュータによるアプローチを使用して、音楽演奏における人間の表現力の複雑 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Reconstructing Human Expressiveness in Piano Performances with a Transformer Network はコメントを受け付けていません

Low-rank Adaptation Method for Wav2vec2-based Fake Audio Detection

要約 自己教師あり音声モデルは、偽音声検出において急速に発展している研究トピック … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Low-rank Adaptation Method for Wav2vec2-based Fake Audio Detection はコメントを受け付けていません

Learning Emotional Representations from Imbalanced Speech Data for Speech Emotion Recognition and Emotional Text-to-Speech

要約 効果的な音声感情表現は、音声感情認識 (SER) および感情的テキスト読み … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Learning Emotional Representations from Imbalanced Speech Data for Speech Emotion Recognition and Emotional Text-to-Speech はコメントを受け付けていません

Efficient Encoder-Decoder and Dual-Path Conformer for Comprehensive Feature Learning in Speech Enhancement

要約 現在の音声強調 (SE) 研究では、チャネル アテンションと空間アテンショ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Efficient Encoder-Decoder and Dual-Path Conformer for Comprehensive Feature Learning in Speech Enhancement はコメントを受け付けていません

An Efficient Speech Separation Network Based on Recurrent Fusion Dilated Convolution and Channel Attention

要約 我々は、拡張畳み込み、マルチスケール融合(MSF)、および畳み込みベースの … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | An Efficient Speech Separation Network Based on Recurrent Fusion Dilated Convolution and Channel Attention はコメントを受け付けていません

Developing Speech Processing Pipelines for Police Accountability

要約 警察の身体装着型カメラは、警察の責任と透明性を向上させる可能性を秘めていま … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Developing Speech Processing Pipelines for Police Accountability はコメントを受け付けていません

HRTF upsampling with a generative adversarial network using a gnomonic equiangular projection

要約 個別化された頭部伝達関数 (HRTF) は、現実的な仮想現実 (VR) お … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG, cs.SD, eess.AS, eess.SP | HRTF upsampling with a generative adversarial network using a gnomonic equiangular projection はコメントを受け付けていません