eess.AS」カテゴリーアーカイブ

Soft Acoustic Curvature Sensor: Design and Development

要約 この論文では、新しい Soft Acoustic Curvature (S … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | Soft Acoustic Curvature Sensor: Design and Development はコメントを受け付けていません

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | 2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation? はコメントを受け付けていません

Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling

要約 ラベル付きデータの欠如は、音声分類タスク、特に認知状態分類などの広範な主観 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling はコメントを受け付けていません

Rethinking Emotion Bias in Music via Frechet Audio Distance

要約 音楽の感情の主観的な性質により、特に単一のオーディオ エンコーダー、感情分 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | Rethinking Emotion Bias in Music via Frechet Audio Distance はコメントを受け付けていません

Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models

要約 最近、単一の統合モデルを使用してさまざまなオーディオ タスクに同時に取り組 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models はコメントを受け付けていません

Speech Boosting: Low-Latency Live Speech Enhancement for TWS Earbuds

要約 このペーパーでは、デバイス上での真のワイヤレス ステレオ (TWS) イヤ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS, eess.SP | Speech Boosting: Low-Latency Live Speech Enhancement for TWS Earbuds はコメントを受け付けていません

Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study

要約 この研究では、自動音声認識 (ASR) のエンコーダーとして再利用された場 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study はコメントを受け付けていません

GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks

要約 高品質でマルチタスクの歌唱データセットの不足は、既存の歌唱データセットの品 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks はコメントを受け付けていません

Revisiting Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations

要約 音声と音楽からの感情認識には、音響的な重複があるため類似点があり、これらの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | Revisiting Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations はコメントを受け付けていません

Data-Driven Room Acoustic Modeling Via Differentiable Feedback Delay Networks With Learnable Delay Lines

要約 過去数十年にわたり、物理的環境の室内音響をエミュレートすることを目的とした … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Data-Driven Room Acoustic Modeling Via Differentiable Feedback Delay Networks With Learnable Delay Lines はコメントを受け付けていません