eess.AS」カテゴリーアーカイブ

Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models

要約 げっ歯類は、社会的コミュニケーションのために広範囲の超音波発声 (USV) … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models はコメントを受け付けていません

Active Listener: Continuous Generation of Listener’s Head Motion Response in Dyadic Interactions

要約 二項音声対話の重要な要素は、対話者の発話に対する聞き手の反応を反映する頭の … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | Active Listener: Continuous Generation of Listener’s Head Motion Response in Dyadic Interactions はコメントを受け付けていません

AfriHuBERT: A self-supervised speech representation model for African languages

要約 この研究では、もともと 147 の言語で事前トレーニングされた、最先端 ( … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | AfriHuBERT: A self-supervised speech representation model for African languages はコメントを受け付けていません

Alignment-Free Training for Transducer-based Multi-Talker ASR

要約 RNN トランスデューサ (RNNT) を拡張して複数話者の音声を認識する … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Alignment-Free Training for Transducer-based Multi-Talker ASR はコメントを受け付けていません

Boosting Hybrid Autoregressive Transducer-based ASR with Internal Acoustic Model Training and Dual Blank Thresholding

要約 ハイブリッド自己回帰トランスデューサー (HAT) は、ブランク事後分布と … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Boosting Hybrid Autoregressive Transducer-based ASR with Internal Acoustic Model Training and Dual Blank Thresholding はコメントを受け付けていません

Word-wise intonation model for cross-language TTS systems

要約 この論文では、ロシア語の単語ごとのイントネーション モデルを提案し、それを … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Word-wise intonation model for cross-language TTS systems はコメントを受け付けていません

Soft Acoustic Curvature Sensor: Design and Development

要約 この論文では、新しい Soft Acoustic Curvature (S … 続きを読む

カテゴリー: cs.RO, cs.SD, eess.AS | Soft Acoustic Curvature Sensor: Design and Development はコメントを受け付けていません

2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?

要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | 2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation? はコメントを受け付けていません

Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling

要約 ラベル付きデータの欠如は、音声分類タスク、特に認知状態分類などの広範な主観 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling はコメントを受け付けていません

Rethinking Emotion Bias in Music via Frechet Audio Distance

要約 音楽の感情の主観的な性質により、特に単一のオーディオ エンコーダー、感情分 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | Rethinking Emotion Bias in Music via Frechet Audio Distance はコメントを受け付けていません