-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「eess.AS」カテゴリーアーカイブ
Investigating the Sensitivity of Automatic Speech Recognition Systems to Phonetic Variation in L2 Englishes
要約 自動音声認識(ASR)システムは、学習させた音声と類似した音声に対して最高 … 続きを読む
Improving Cascaded Unsupervised Speech Translation with Denoising Back-translation
要約 音声翻訳モデルの多くはパラレルデータに大きく依存しており、特に低リソース言 … 続きを読む
Streaming Joint Speech Recognition and Disfluency Detection
要約 失語症検出は、主に音声認識の後処理として、パイプラインアプローチで解決され … 続きを読む
The Pipeline System of ASR and NLU with MLM-based Data Augmentation toward STOP Low-resource Challenge
要約 本論文では、ICASSP Signal Processing Grand … 続きを読む
Speaker Diaphragm Excursion Prediction: deep attention and online adaptation
要約 スピーカ保護アルゴリズムは、再生信号の特性を活用し、特に小さなスピーカを持 … 続きを読む
Knowledge Transfer For On-Device Speech Emotion Recognition with Neural Structured Learning
要約 音声感情認識(SER)は、ヒューマンコンピュータインタラクション(HCI) … 続きを読む
CoMoSpeech: One-Step Speech and Singing Voice Synthesis via Consistency Model
要約 デノイジング拡散確率モデル(DDPM)は、音声合成において有望な性能を示し … 続きを読む
V2Meow: Meowing to the Visual Beat via Music Generation
要約 タイトル:V2Meow:音楽生成によるビジュアルビートのミウシカ 要約: … 続きを読む
Speech Driven Video Editing via an Audio-Conditioned Diffusion Model
要約 タイトル:音声条件付き拡散モデルによる音声駆動のビデオ編集 要約:  … 続きを読む