-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models
要約 げっ歯類は、社会的コミュニケーションのために広範囲の超音波発声 (USV) … 続きを読む
Active Listener: Continuous Generation of Listener’s Head Motion Response in Dyadic Interactions
要約 二項音声対話の重要な要素は、対話者の発話に対する聞き手の反応を反映する頭の … 続きを読む
AfriHuBERT: A self-supervised speech representation model for African languages
要約 この研究では、もともと 147 の言語で事前トレーニングされた、最先端 ( … 続きを読む
Alignment-Free Training for Transducer-based Multi-Talker ASR
要約 RNN トランスデューサ (RNNT) を拡張して複数話者の音声を認識する … 続きを読む
Boosting Hybrid Autoregressive Transducer-based ASR with Internal Acoustic Model Training and Dual Blank Thresholding
要約 ハイブリッド自己回帰トランスデューサー (HAT) は、ブランク事後分布と … 続きを読む
Word-wise intonation model for cross-language TTS systems
要約 この論文では、ロシア語の単語ごとのイントネーション モデルを提案し、それを … 続きを読む
Soft Acoustic Curvature Sensor: Design and Development
要約 この論文では、新しい Soft Acoustic Curvature (S … 続きを読む
2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?
要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling
要約 ラベル付きデータの欠如は、音声分類タスク、特に認知状態分類などの広範な主観 … 続きを読む