-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
「eess.AS」カテゴリーアーカイブ
The First VoicePrivacy Attacker Challenge Evaluation Plan
要約 First VoicePrivacy Attacker Challenge … 続きを読む
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)
要約 Explainable AI for the Arts (XAIxArts … 続きを読む
Advocating Character Error Rate for Multilingual ASR Evaluation
要約 自動音声認識 (ASR) システムは従来、英語のデータセットを使用して評価 … 続きを読む
Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition
要約 Visual Speech Recognition (VSR) は、唇の動 … 続きを読む
Music to Dance as Language Translation using Sequence Models
要約 音楽から適切な振り付けを合成することは未解決の問題のままです。 振り付け生 … 続きを読む
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation in Low-Data Regimes
要約 擬似ラベルを使用して Whisper の知識を小さなモデルに抽出する最近の … 続きを読む
Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding
要約 この文書の目標は、音声品質の犠牲を最小限に抑えながら、コーデックベースの音 … 続きを読む
Robust ASR Error Correction with Conservative Data Filtering
要約 大規模言語モデルに基づく誤り訂正 (EC) は、自動音声認識 (ASR) … 続きを読む
GTSinger: A Global Multi-Technique Singing Corpus with Realistic Music Scores for All Singing Tasks
要約 高品質でマルチタスクの歌唱データセットの不足は、既存の歌唱データセットの品 … 続きを読む