-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Addressing Emotion Bias in Music Emotion Recognition and Generation with Frechet Audio Distance
要約 音楽感情の複雑な性質は、特に単一のオーディオエンコーダー、感情分類器、また … 続きを読む
Cross-Lingual Speech Emotion Recognition: Humans vs. Self-Supervised Models
要約 音声感情認識(SER)のための自己監視学習(SSL)モデルを利用して、効果 … 続きを読む
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling
要約 ラベル付けされたデータの欠如は、音声分類タスク、特に認知状態分類などの広範 … 続きを読む
Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction
要約 迅速なエンジニアリングを使用して音声感情を注釈と認識して、最近、大規模な言 … 続きを読む
Exploring Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations
要約 音楽と音楽からの感情の認識は、音響の重複のために類似点を共有しており、これ … 続きを読む
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation
要約 オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む
Versatile Framework for Song Generation with Prompt-based Control
要約 Song Generationは、さまざまなプロンプトに基づいて制御可能な … 続きを読む
Non-native Children’s Automatic Speech Assessment Challenge (NOCASA)
要約 このペーパーでは、「非ネイティブチルドレンの自動音声評価」(NOCASA) … 続きを読む
Mitigating Timbre Leakage with Universal Semantic Mapping Residual Block for Voice Conversion
要約 音声変換(VC)は、コンテンツを保存することにより、ソース音声をターゲット … 続きを読む
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation
要約 オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む