-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Exploring Attention Mechanisms for Multimodal Emotion Recognition in an Emergency Call Center Corpus
要約 人間の意思決定を強化する感情検出テクノロジーは、現実世界のアプリケーション … 続きを読む
Speaker Embeddings as Individuality Proxy for Voice Stress Detection
要約 話者の精神状態が音声を調整するため、認知的または身体的負荷によってもたらさ … 続きを読む
EmotionNAS: Two-stream Neural Architecture Search for Speech Emotion Recognition
要約 音声感情認識 (SER) は、人間とコンピューターの対話における重要な研究 … 続きを読む
Reconstructing Human Expressiveness in Piano Performances with a Transformer Network
要約 コンピュータによるアプローチを使用して、音楽演奏における人間の表現力の複雑 … 続きを読む
Low-rank Adaptation Method for Wav2vec2-based Fake Audio Detection
要約 自己教師あり音声モデルは、偽音声検出において急速に発展している研究トピック … 続きを読む
Learning Emotional Representations from Imbalanced Speech Data for Speech Emotion Recognition and Emotional Text-to-Speech
要約 効果的な音声感情表現は、音声感情認識 (SER) および感情的テキスト読み … 続きを読む
Efficient Encoder-Decoder and Dual-Path Conformer for Comprehensive Feature Learning in Speech Enhancement
要約 現在の音声強調 (SE) 研究では、チャネル アテンションと空間アテンショ … 続きを読む
An Efficient Speech Separation Network Based on Recurrent Fusion Dilated Convolution and Channel Attention
要約 我々は、拡張畳み込み、マルチスケール融合(MSF)、および畳み込みベースの … 続きを読む
Developing Speech Processing Pipelines for Police Accountability
要約 警察の身体装着型カメラは、警察の責任と透明性を向上させる可能性を秘めていま … 続きを読む
HRTF upsampling with a generative adversarial network using a gnomonic equiangular projection
要約 個別化された頭部伝達関数 (HRTF) は、現実的な仮想現実 (VR) お … 続きを読む