-
最近の投稿
- Topological mapping for traversability-aware long-range navigation in off-road terrain
- Equality Constrained Diffusion for Direct Trajectory Optimization
- Learning-Based Autonomous Navigation, Benchmark Environments and Simulation Framework for Endovascular Interventions
- Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case
- Bi-Level Motion Imitation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (27641) cs.CL (20879) cs.CR (2167) cs.CV (34375) cs.LG (32373) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
「cs.SD」カテゴリーアーカイブ
Learning Spatially-Aware Language and Audio Embedding
要約 人間は、不正確な自然言語記述が与えられたとしても、音のシーンを思い描くこと … 続きを読む
Spontaneous Informal Speech Dataset for Punctuation Restoration
要約 現在、句読点復元モデルは、ほぼ完全に構造化され、スクリプト化されたコーパス … 続きを読む
WER We Stand: Benchmarking Urdu ASR Models
要約 このペーパーでは、ウルドゥー語自動音声認識 (ASR) モデルの包括的な評 … 続きを読む
High-Resolution Speech Restoration with Latent Diffusion Model
要約 従来の音声強調方法は、単一の種類の歪みに焦点を当てて復元タスクを過度に単純 … 続きを読む
Learning Source Disentanglement in Neural Audio Codec
要約 ニューラル オーディオ コーデックは、連続オーディオ信号を個別のトークンに … 続きを読む
The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection
要約 この論文では、高齢者の幸福を促進することを目的としたスマート ホーム アプ … 続きを読む
Wave-U-Mamba: An End-To-End Framework For High-Quality And Efficient Speech Super Resolution
要約 音声超解像度 (SSR) は、失われた高周波成分を復元することによって、低 … 続きを読む
Towards Supervised Performance on Speaker Verification with Self-Supervised Learning by Leveraging Large-Scale ASR Models
要約 自己教師あり学習 (SSL) の最近の進歩により、話者検証 (SV) にお … 続きを読む
Low-Resourced Speech Recognition for Iu Mien Language via Weakly-Supervised Phoneme-based Multilingual Pre-training
要約 主流の自動音声認識 (ASR) テクノロジーでは、通常、数百時間から数千時 … 続きを読む
Self-Supervised Syllable Discovery Based on Speaker-Disentangled HuBERT
要約 自己教師付き音声表現学習は、転写されていない音声から意味のある特徴を抽出す … 続きを読む