-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
AV-SAM: Segment Anything Model Meets Audio-Visual Localization and Segmentation
要約 タイトル: AV-SAM: Segment Anything Model … 続きを読む
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds
要約 タイトル:CryCeleb:乳児の泣き声に基づく話者認証データセット 要約 … 続きを読む
AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis
要約 タイトル:AQ-GT:時間的に整列し量子化されたGRU-Transform … 続きを読む
Going In Style: Audio Backdoors Through Stylistic Transformations
要約 タイトル:Going In Style: Audio Backdoors … 続きを読む
Lessons Learned in ATCO2: 5000 hours of Air Traffic Control Communications for Robust Automatic Speech Recognition and Understanding
要約 タイトル:ATCO2における学習成果:堅牢な自動音声認識と理解のための50 … 続きを読む
The Pipeline System of ASR and NLU with MLM-based Data Augmentation toward STOP Low-resource Challenge
要約 【タイトル】MLMベースのデータ拡張によるASRおよびNLUのパイプライン … 続きを読む
A Study on the Integration of Pipeline and E2E SLU systems for Spoken Semantic Parsing toward STOP Quality Challenge
要約 タイトル:STOP Quality Challengeのためのスポークンセ … 続きを読む
Self-supervised learning for infant cry analysis
要約 タイトル:自己教師付き学習による幼児の泣き声分析 要約: – … 続きを読む
Long-Term Rhythmic Video Soundtracker
要約 タイトル:長期リズミックビデオサウンドトラッカー 要約: – … 続きを読む
Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings
要約 タイトル:臨床設定における自動音声認識パフォーマンスの改善に向けたClin … 続きを読む