-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
Learning to Dub Movies via Hierarchical Prosody Models
要約 タイトル:階層的プロソディモデルに基づく映画の吹き替え学習 要約: ・映画 … 続きを読む
Designing and Evaluating Speech Emotion Recognition Systems: A reality check case study with IEMOCAP
要約 【タイトル】IEMOCAPを用いた発話感情認識システムの設計と評価:現実的 … 続きを読む
Practical Conformer: Optimizing size, speed and flops of Conformer for on-Device and cloud ASR
要約 タイトル:実用的なConformer:オンデバイスおよびクラウドASRのた … 続きを読む
Lego-Features: Exporting modular encoder features for streaming and deliberation ASR
要約 タイトル: Lego-Features:ストリーミングおよび審議 ASR … 続きを読む
Multilingual Word Error Rate Estimation: e-WER3
要約 タイトル:Multilingual Word Error Rate Est … 続きを読む
SIG-VC: A Speaker Information Guided Zero-shot Voice Conversion System for Both Human Beings and Machines
要約 タイトル:SIG-VC:人間と機械の両方のためのスピーカー情報ガイド付きゼ … 続きを読む
Unsupervised Anomaly Detection and Localization of Machine Audio: A GAN-based Approach
要約 タイトル:機械音声の非教師あり異常検出と位置特定:GANベースのアプローチ … 続きを読む
On Batching Variable Size Inputs for Training End-to-End Speech Enhancement Systems
要約 タイトル:エンドツーエンド音声強化システムのトレーニングにおける可変サイズ … 続きを読む
Dialog act guided contextual adapter for personalized speech recognition
要約 タイトル:パーソナライズド音声認識のためのダイアログアクト誘導コンテキスト … 続きを読む