-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.SD」カテゴリーアーカイブ
Fast and accurate factorized neural transducer for text adaption of end-to-end speech recognition models
要約 ニューラル トランスデューサは、その自然なストリーミング機能により、現在、 … 続きを読む
Metric-oriented Speech Enhancement using Diffusion Probabilistic Model
要約 ディープ ニューラル ネットワーク ベースの音声強調技術は、ペアのトレーニ … 続きを読む
Evaluating Automatic Speech Recognition in an Incremental Setting
要約 自動音声認識の信頼性が向上したことで、日常的に使用されるようになりました。 … 続きを読む
ProsAudit, a prosodic benchmark for self-supervised speech models
要約 ProsAudit は、自己教師あり学習 (SSL) 音声モデルの構造韻律 … 続きを読む
Unsupervised Noise adaptation using Data Simulation
要約 ディープ ニューラル ネットワーク ベースの音声強調アプローチは、教師あり … 続きを読む
Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition
要約 スピーチエンハンスメント (SE) は、ダウンストリームの自動音声認識 ( … 続きを読む
UML: A Universal Monolingual Output Layer for Multilingual ASR
要約 ワード ピース モデル (WPM) は、最先端のエンド ツー エンド自動音 … 続きを読む
Improving Contextual Spelling Correction by External Acoustics Attention and Semantic Aware Data Augmentation
要約 名前、場所などのコンテキスト情報を使用して、エンドツーエンド (E2E) … 続きを読む
Exploring Effective Distillation of Self-Supervised Speech Models for Automatic Speech Recognition
要約 近年、音声処理における自己教師あり学習 (SSL) が大きく進歩しています … 続きを読む
MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition
要約 通常、エンド ツー エンドの自動音声認識 (ASR) は、ドメイン シフト … 続きを読む