-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
OLISIA: a Cascade System for Spoken Dialogue State Tracking
要約 Dialogue State Tracking (DST) は音声対話シス … 続きを読む
Let There Be Sound: Reconstructing High Quality Speech from Silent Videos
要約 この研究の目標は、唇の動きだけから高品質の音声を再構築することであり、この … 続きを読む
Spoken Language Intelligence of Large Language Models for Language Learning
要約 人々は長い間、実生活の状況を支援できる会話システムを望んできましたが、大規 … 続きを読む
AudioFormer: Audio Transformer learns audio feature representations from discrete acoustic codes
要約 我々は、AudioFormer という名前のメソッドを提案します。このメソ … 続きを読む
How to Estimate Model Transferability of Pre-Trained Speech Models?
要約 この研究では、ターゲット タスクを微調整するための事前トレーニング済み音声 … 続きを読む
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
要約 この論文では、幼児の泣き声のラベル付きコレクションである Ubenwa C … 続きを読む
Exploiting Diverse Feature for Multimodal Sentiment Analysis
要約 このペーパーでは、MuSe 2023 マルチモーダル感情分析チャレンジの … 続きを読む
Towards Automated Animal Density Estimation with Acoustic Spatial Capture-Recapture
要約 受動的音響モニタリングは、音響的には活動的だが視覚的に調査するのが難しい野 … 続きを読む
MultiPA: a multi-task speech pronunciation assessment system for a closed and open response scenario
要約 自動音声発音評価の設計は、クローズド応答シナリオとオープン応答シナリオに分 … 続きを読む