「eess.AS」カテゴリーアーカイブ

Addressing Emotion Bias in Music Emotion Recognition and Generation with Frechet Audio Distance

投稿日: 2025年5月1日作成者: jarxiv

要約音楽感情の複雑な性質は、特に単一のオーディオエンコーダー、感情分類器、また … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Cross-Lingual Speech Emotion Recognition: Humans vs. Self-Supervised Models

投稿日: 2025年5月1日作成者: jarxiv

要約音声感情認識（SER）のための自己監視学習（SSL）モデルを利用して、効果 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC, cs.SD, eess.AS | コメントを受け付けていません

Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling

投稿日: 2025年5月1日作成者: jarxiv

要約ラベル付けされたデータの欠如は、音声分類タスク、特に認知状態分類などの広範 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction

投稿日: 2025年5月1日作成者: jarxiv

要約迅速なエンジニアリングを使用して音声感情を注釈と認識して、最近、大規模な言 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Exploring Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations

投稿日: 2025年5月1日作成者: jarxiv

要約音楽と音楽からの感情の認識は、音響の重複のために類似点を共有しており、これ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation

投稿日: 2025年5月1日作成者: jarxiv

要約オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Versatile Framework for Song Generation with Prompt-based Control

投稿日: 2025年4月30日作成者: jarxiv

要約 Song Generationは、さまざまなプロンプトに基づいて制御可能な … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Non-native Children’s Automatic Speech Assessment Challenge (NOCASA)

投稿日: 2025年4月30日作成者: jarxiv

要約このペーパーでは、「非ネイティブチルドレンの自動音声評価」（NOCASA） … 続きを読む →

カテゴリー: cs.CL, eess.AS | コメントを受け付けていません

Mitigating Timbre Leakage with Universal Semantic Mapping Residual Block for Voice Conversion

投稿日: 2025年4月30日作成者: jarxiv

要約音声変換（VC）は、コンテンツを保存することにより、ソース音声をターゲット … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation

投稿日: 2025年4月30日作成者: jarxiv

要約オーディオディープフェイクは、デジタルセキュリティと信頼に対する脅威の高ま … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

「eess.AS」カテゴリーアーカイブ

Addressing Emotion Bias in Music Emotion Recognition and Generation with Frechet Audio Distance

Cross-Lingual Speech Emotion Recognition: Humans vs. Self-Supervised Models

Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling

Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction

Exploring Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations

End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation

Versatile Framework for Song Generation with Prompt-based Control

Non-native Children’s Automatic Speech Assessment Challenge (NOCASA)

Mitigating Timbre Leakage with Universal Semantic Mapping Residual Block for Voice Conversion

End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation

最近の投稿

最近のコメント

アーカイブ

カテゴリー