-
最近の投稿
- Non-Gaited Legged Locomotion with Monte-Carlo Tree Search and Supervised Learning
- Agricultural Industry Initiatives on Autonomy: How collaborative initiatives of VDMA and AEF can facilitate complexity in domain crossing harmonization needs
- Physics-Grounded Differentiable Simulation for Soft Growing Robots
- SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning
- Online Trajectory Replanner for Dynamically Grasping Irregular Objects
-
最近のコメント
表示できるコメントはありません。 cs.AI (32994) cs.CL (24943) cs.CR (2553) cs.CV (39129) cs.LG (37903) cs.RO (19188) cs.SY (2936) eess.IV (4690) eess.SY (2930) stat.ML (4984)
「cs.SD」カテゴリーアーカイブ
AfriHuBERT: A self-supervised speech representation model for African languages
要約 この研究では、もともと 147 の言語で事前トレーニングされた、最先端 ( … 続きを読む
Alignment-Free Training for Transducer-based Multi-Talker ASR
要約 RNN トランスデューサ (RNNT) を拡張して複数話者の音声を認識する … 続きを読む
Boosting Hybrid Autoregressive Transducer-based ASR with Internal Acoustic Model Training and Dual Blank Thresholding
要約 ハイブリッド自己回帰トランスデューサー (HAT) は、ブランク事後分布と … 続きを読む
Word-wise intonation model for cross-language TTS systems
要約 この論文では、ロシア語の単語ごとのイントネーション モデルを提案し、それを … 続きを読む
Soft Acoustic Curvature Sensor: Design and Development
要約 この論文では、新しい Soft Acoustic Curvature (S … 続きを読む
2D or not 2D: How Does the Dimensionality of Gesture Representation Affect 3D Co-Speech Gesture Generation?
要約 共同スピーチのジェスチャーはコミュニケーションの基本です。 最近の深層学習 … 続きを読む
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling
要約 ラベル付きデータの欠如は、音声分類タスク、特に認知状態分類などの広範な主観 … 続きを読む
Rethinking Emotion Bias in Music via Frechet Audio Distance
要約 音楽の感情の主観的な性質により、特に単一のオーディオ エンコーダー、感情分 … 続きを読む
Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models
要約 最近、単一の統合モデルを使用してさまざまなオーディオ タスクに同時に取り組 … 続きを読む